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Ari E Ey sk PH MI] ЕН АЕ, Ou ДЕАК EIC ЛЕ ИТ p. И АДЕ A 20 As 
EAA ES Eam. fd iis Sob МН, ЕМКІЕЕ ЫЧКЫН. ШЕЙ 
iB. ЖІП, EARI BU MER Be Mon B m ЕН SO SUE CT ERER AIE, A ЖЕ 
X 14 21 性 纪 的 RONDA REY а о k. {НИ ИДЕ E Kg EIL [RI]. t b FB 
E HIP И G BKR ACT К ЗЕ Н. 同时， 以 美国 为 代表 的 西方 国家 计算 机 科学 教育 
经 历 了 充分 的 发 展 ,， 产生 了 一 批 有 着 巨大 影响 力 的 经 典 载 材 ， 因 此 ， 久 批判、 借鉴 的 态度 有 选择 
地 引进 这 些 国 外 经 典 计 算 机 救 和 烤 ， 将 促进 国内 教学 体系 科 国 外 接轨 ， 大 大 推动 我 国 计 算 机 教育 串 
业 的 发 展 

中 国电 力 出 版 社 进入 计算 机 隔 书 市 场 忆 有 近 6 个 年 头 ， 通 过 以 持 “高 端 、 情 品 、 经 典 ” 战 略 ， 
致力 于 与 国外 著名 出 版 机 构 合 作 , 出 版 了 大 批 铺 入 计算 机 业界 和 教育 界 赞 誉 的 作品 , 遂 过 与 信息 按 
RAA AA БВ 0, FEH EAA. 中 国电 为 出 版 社 二 时 推出 了 “国外 经 典 计 算 
机 科学 孝 材 ”的 出 版 计划 ， 本 次 末 材 出 版 计划 是 和 美国 最 大 的 计算 机 教育 出 版 机 村 
fi ЖЩ (Addison-Wesley, Prentice-Hall 5E Ap EF E PASO AE RERS ERRA AT 
经 典 教材 资源 ， 确 保 了 教材 选 题 的 权威 经 典 ， 

Aux S44 p ЕЕЕ. MES. RIEKA T Hp HERE. bg AE 
— ift Pro ЕЖЕН k SCR SE Rn ms ЧҮ ЖШ ISO. WIN. UERITAS 
BOB Ж. HAEC. АН НН ARTT AAMA, ЛОЖА. TRAIA EE МН 
"ЭЛНИ UM IR P. 对 国外 教材 做 了 理性 的 分 析 , 确立 了 依托 国家 教育 计划 , 传播 先进 教学 理念 ， 
为 册 状 符合 社会 古 于 的 骨 素 质 创 新 型 人 咎 服务 ， 玉 作为 本 次 “国外 经 典 计 算 机 科学 教材 ”出 虑 计 
яа 

我 们 从 2002) F + PR ЕМИ ИТТЕ, ЛЕКТЫН. ӨЗ 
T HG SMS STE. ЖЕМЕ, HOD bOKH АЕ ЖМА. 

1. WK A PB ААБ. ДЕНЕ ОНЫ E MER Е RS ВДАЛЕ, 

МААЕ Л, ДЕ ЦЕ. 

2. ARA t l ОУЕН, ANNEE ЕНІ, Td ERR З A MI 
炎 任 选 EF, 

3. i KE [M FSI АСНА Ж. НАНЫН ЧЕТЕ POTE) ЕН Ж Ж. ЕЛ) TURCA lir 
МЕ, ЛАДЫ ЕЖ, 

4. ERER OA LEAR s И S ee hm k. PHARES. ЛИШ ЛЕШ. ӘҢ 
HUM ET аЛ ш. 

5. 38 XT M БАШ ЕМ F x S m BITES uf IS. o Bm e R Е — М 
Г. 

6. 对 教材 出 厂 箱 后 期 工作 ， 如 审 校 、 编 辑 、 排 版 、 印 刷 进 行 了 严格 的 质 虽 把 关 。 





е ЕЗ алат iie., t; WE KA ЛЕП М. Mii. АЙП 
he [ККЖ Bak HR RP ACT TERR ЛОР. МЕ ЖЫК EE DEF ПО К: 
ШІ, ІП Stallings, Date. Ullman, Aho, Bryant, Sedgewick $F, ЖИП КИЕ НЫЙ) дЕ Н Л, ЕЮ 
从 多 国外 一 流 大 学 如 Stanford University; MIT, UC Bekerley, Carnegie Mellon Univeristy. 
University of Michigan 等 采用 为 教材 ， 报 订 的 第 - :阶段 出 版 计划 包括 30 НІН. A TES UIT 
Би. ЖЫШ, ЕЖ. MH ЖЕ, ЖЕ. ЖЕН. WU LE. UE. (^ 
网 络 、 离 散 数 学 等 计算 机 专业 核心 基础 课程 ， 基 本 满足 国内 计算 机 专业 的 教学 要 求 。 

此 外 ， 为 了 帮助 广大 任课 教师 加 尝 对 本 系列 教材 的 理 角 ,减轻 他 人 的 备课 难度 ， 我 们 从 国外 
出 版 机 构 引 进 了 大 批 的 课程 教学 辅助 资料 ， 并 积 级 延 请 国内 优秀 缉 旭 ， ММЕН RAUM t|: 
Еее, РНЕ ЗА ОНАН НЕМ. 

H TS b mS ESLE BG IEAUIBRIE EMO. ЖАЙ. ЫЙ, ЖІП ГН 
me Eh piri pik m h. ИГ KA HUK Me HL BE VERU RE COE NICE VE e ЈА Д 
AS LET. НЕК ЖАЛ АЯ: 
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作为 CEFR ӨТЕ SAET MAAA. ИШТ. ERE — ЕДА АЛЕП 
Js B LES T — B Ti AS ЕН 8 3k ak ЫҢ, АУАНЫ рос 环境 下 的 编 详 一 点 问题 者 
设 有 ， 但 只 要 一 实际 运行 ， 就 会 报 段 错 误 。 我 在 了 这 段 代 码 后 ， 立 刻 就 意识 到 问题 出 现在 哪里 了 一 一 
ЕШ ЗЕН Н НЕТ -个 16MB 的 局 部 变量 导致 栈 诬 出 。 类 似 这 样 的 向 题 ， 还 会 有 许多 . 不 过 在 这 
些 问题 中 , 让 程序 员 有 麻烦 的 忆 经 不 是 编程 诸 言 本 身 的 问题 ,而 是 需 亏 程序 员 更 好 地 理解 计算 机 系统 ， 
知道 程序 如 何在 计算 机 上 上 被 执行 。 理 解 计 算 机 系统 , 不 是 简单 地 从 书市 上 购买 一 些 介 绍 计算 机 系统 的 
P. 恋 一 读 而 已 . 馆 今 为 小 ， 我 对 市 面 上 这 类 节 的 了 解 是 ; 对 于 太 多 数 程序 员 而 言 它们 都 过 于 专业 化 ， 
叶 以 书 的 内 容 各 语 许 组 织 上 都 懈 重 于 原型 的 介绍 ,一般 程 序 员 很 准 有 时 间 和 精 万 去 消化 和 吸收 书 中 的 
内 容 ， 更 无 从 用 这 些 计算 机 系统 的 知识 来 帮助 自己 解决 程序 问题 ， 

事实 上 上， 总 级 语言 编程 和 计算 机 系统 被 编程 环 谤 如 gee 划分 成 两 张 皮 ， 尽 管 程序 员 能 用 高 级 语 
ARAN RAL ER EEn REA. 可 是 却 不 一 定 能 很 清楚 地 知道 计算 机 是 如 何 解 又 和 执行 程序 代 
码 的 。 

我 本 人 是 - -个 计算 机 专业 科班 出 映 的 入， 学 生 期 间 学 习 到 许多 关于 计算 机 系统 的 知识 。 可 在 实 
际 研 听 上 作 中 ， 过 去 所 学 的 计算 机 系统 知识 变 得 遥远 和 模糊 。1999 年 初 ， 出 于 研究 兴趣 的 日 的 ， 我 
设计 了 一 个 局 性 能 网 络 服务 器 结构 ， 并 编写 了 它 的 实现 。 在 此 期 间 ， 使 我 明白 一 个 高 性 能 服务 器 程序 
5 了 计算 机 系统 之 间 的 唇齿 相仿 的 关系 。 过 去 ， 促 使 我 建立 高 级 语言 和 计算 机 系统 的 联系 来 主要 自 于 研 
究 的 疆 为 ， 其 采用 的 方法 是 遍 寻 国外 关于 系统 编程 的 地 性 列表 ， 并 结合 以 往 所 学 的 计算 机 系统 知识 。 
这 种 方法 固然 能 帮助 我 解决 实际 序 辜 到 的 问题 , 但 却 需 旨 花费 大 量 的 时 间 且 没有 条 理 。2003 年 元 月 ， 
编辑 部 让 我 带 助 他 售 从 一 批 刚 出 版 的 外 文书 中 挑 一 些 可 以 在 国内 推广 的 书 ， 我 一 眼 就 看 中 了 这 本 由 
Bryant 和 O'Hallaron 所 著 的 《Computer Systems: A Programmer's Perspective), 它 就 是 我 过 去 想 要 的 书 ， 
我 相信 也 是 每 一 个 想 了 解 计 算 机 系统 的 程序 员 想 要 的 书 。 我 过 不 及 待 地 从 编辑 手中 抢 下 此 书 的 翻译 工 
作 ， 这 个 临时 添加 的 任务 改变 了 我 和 另 一 位 译 者 2003 年 的 生活 。2003 年 8 月 底 ， 终 于 完成 此 书 的 翻 
译 工作 ， 并 起 中 文 名 为 《深入 理解 计算 机 系统 》， 

4 深入 理解 计算 机 系统 》 的 最 大 优点 是 为 程序 员 描 述 计 算 机 系统 的 实现 细节 ， 帮 功 其 在 大 脑 中 
构造 一 个 层次 型 的 计算 机 系统 ， 从 最 底层 的 数据 在 内 存 中 的 表示 {如 大 多 数 程序 员 一 自 陌生 或 疑惑 的 
季 点 数 表 小 )， 到 流水 线 指令 的 构成 ， 到 虚 扫 存储 器 ， 到 编译 系统 ， 到 动态 加 载 库 ， 到 最 后 的 用 户 态 
МЛ. RPA PN- 条 主线 是 使 程序 员 在 设计 程序 时 ， 能 充分 意识 到 计算 机 系统 的 重要 性 ， 建 立 起 被 
所 号 程序 可 能 被 执行 的 数据 或 指令 流 图 ， 明 白 当 程序 被 执行 时 ， 到 底 发 生 了 什么 事 。 从 而 能 设计 出 一 
个 高 效 、HJ 殉 植 ， 健 杜 的 程序 ， 并 能 够 更 快 地 对 程序 排 错 、 调 整 程序 性 能 等 。 

本 书 是 通过 程序 员 的 视角 来 介绍 计算 机 系统 ， 即 首先 把 高 级 语言 转换 成 计算 机 所 能 理解 的 一 种 
中 国 格式 《如 沪 渍 语言)， 然 后 描述 计算 机 奶 何 解释 和 执行 这 些 中 间 格 式 的 程序 ， 是 系统 的 哪 一 部 分 
影响 程序 的 执行 效率 。 所 以 ， 在 讲述 计算 机 系统 知识 的 同时 ， 也 顺便 给 出 了 关于 C 语言 和 汇编 语言 


Cru f Be ӨРНЕК) ЕЛІМ pik, АЖЖ АЛҚАНЫҢ, ІНІН, ИЩ 
Eko Iki АЖЕ РАН ЖЕНЕ ША e FEF EBE. K Caps. 

КЕЕ АВК РЕЯ САИМ RIO АРНАП ЖЕЛАЛ Н, =: 
数据 表 术 ; 汇编 语言 和 并 - 编 级 计算 机 体系 结构 ; 处 理 器 设计 : 程序 的 性 能 度 其 和 优化 ; Fri nat as. 
链接 器 和 编 详 器 ; Rom VO 和 设备 的 存储 器 层次 缚 构 ， 虚 拟人 存储器 ， 外 部 存 悄 管理 ， "ЕТ. (е АЕ 
程控 制 。 对 这 些 椒 间 领 域 知 识 匆 介绍 使 我 们 能 在 编写 系统 程序 时 ， 基 十 系统 析 能 的 考虑， 未 取 一 个 里 
好 的 折 中 方案 。 

本 书 强调 对 计算 机 系统 的 概念 的 理解 ， 但 并 不 意味 着 不 动手 。 如 果 按 照 本 书 的 安排 做 每 一 草 语 
面 的 习题 , 将 有 助 于 理解 和 加 深 正文 所 述 的 概念 和 知识 ,并 请 有 时候, 可 以 从 实际 动手 中 学 习 到 新 的 
知识 。 如 果 不 动手 ， 空 洞 地 去 看 文字 ， 是 很 难 理解 文字 背后 的 意义 的 。 我 个 人 的 经 验 是 ， 有 许多 系统 
设计 和 概念 ， 看 似 简单 或 不 理解 ,可 - 旦 自己 惑 于 做 同样 的 试验 , 才 更 明 广 当初 的 汕 计 者 为 什么 要 如 
此 设计 , 计算 机 系统 就 像 白 然 界 的 生态 环境 ， 对 每 - 个 部 件 的 设计 都 要 求 它 能 融 治 地 和 系统 内 其 他 部 
件 和 平 相处 ， 我 们 不 能 站 在 “个 微观 的 视角 去 看 待 系统 部 件 的 没 计 是 否 最 优 ,而 应 沪 从 宏观 采 观 察 和 
思考 。 

为 方便 理解 本 书 的 内 容 ， 本 书 的 读者 假定 具备 ССН). РА ФАР ӘНЕ Қ 
学 (CMU) 的 教材 ， 忆 被 其 他 一 些 著 各 的 大 学 也 选用 为 教材 ， 因 此 ， 本 书 的 读者 不 仅 羽 是 堵 些 因 
为 工作 和 兴趣 而 关注 本 书 的 人 ,还 包括 一 些 在 校 的 大 学 生 ， 作 为 他 们 的 教材 或 辅助 性 资料 。 个 人 认 
为 ， 在 以 学 生 越 早 接触 本 书 的 内 容 ， 将 越 有 利于 他 们 学 习 计算 机 的 相关 课程 ， 培 头 对 计算 机 系统 的 
研究 兴趣 。 

总 而 言 之 ,《 深 入 起 解 计算 机 系统 》…- 要 是 一 个 桥梁 ， 它 帮助 程序 员 衔接 了 计算 机 系统 的 各 个 信 
域 的 知识 ， 为 程序 员 构造 了 一 个 概念 性 框架 。 对 于 各 个 领域 (如 计算 机 系统 结构 、 处 理 器 ,操作 系统 、 
编译 器 、 网 络 、 并 发 编码) 的 知识 进一步 获取 ， 偿 而 鉴 参考 相关 书 糙 。 

参加 翻 详 的 还 有 压 亦 利 、 易 金华 和 陈 永 兴 等 ， 在 此 也 特别 表示 感谢 。 

由 于 此 书 的 内 容量 大 , ЖЕН ЕЕЕ ЧЕН, 尽管 我 们 十 分 努力 , 但 还 是 难以 避免 出 现 错 误 ， 
以 及 有 在 许 多 不 尽 人 意 的 地 方 ， 欢 迎 广 大 读者 批评 指正 ， 以 便 改进 。 
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2004.215 
于 北京 中 关 村 (中科院 ) 青年 公 高 


关于 术语 的 翻译 


车 1 路 起 计算 机 的 多 个 领域 ， 涉及 了 许多 专业 的 本 证。 在 翻译 的 过 程 中 ， 我 们 尽 囊 能 地 忠实 反映 
原文 的 意思 ,但 并 不 是 每 个 术语 的 翻 详 都 那么 恰当 ， 符合 每 个 读者 的 阅读 斗 惯 。 不 叮 半 人 金地 ， 对 某 些 
术语 的 翻 详 带 了 我 们 个 人 的 半 惯 和 和 偏好, 希望 读者 谅解 ， 下 夯 ， 我 们 解释 在 本 书 中 频繁 出 现 的 一 些 术 
ҮЕ. 


directive 


jT uS RS CA ed Ж Ш#пс1шде 的 语句 , 或 汇编 语言 中 类 似 .pos БЕН). ИЫН 
岂 ， 这 个 单词 应 访 译 做 “指令 ”比较 恰当 ， ІН ТАН s MERI. ІНЕ, fE directive 单词 出 现 的 地 
A. EEM EHR Г instruction 单间 《这 种 现象 以 第 3 章 为 主 )， 其 中 文 的 含义 也 是 “指令 ”"”。 相 比 于 
directive. instruction 显然 是 一 个 更 缀 势 的 单词 ， 为 了 从 中 文字 面 上 区 分 这 此 个 单间， 方便 读者 阅读 ， 
ЭП АЖЕ ЖААЖ UR E F, 99 directive 为 命令 ， 


operation 


这 是 个 遍布 全 书 的 单词 。 它 众多 的 意思 中 有 两 个 是 :“ 操 作 ” 和 “运算 ”。 对 这 个 单词 的 翻 详 ， 
我 们 没有 来 用 一刀 切 的 方法 ， 而 是 尽 可 能 采用 国内 读者 的 习惯 来 翻 详 。 根据 我 自己 的 切身 体会 ， 以 及 
网 友 对 operation 译 法 的 讨论 ， 我 们 更 倾向 于 在 数学 的 领域 内 使 用 “运算 ” 而 在 计算 机 领域 使 用 “ 择 
作 ”。 基 于 这 个 认识 ， 以 及 章节 内 容 的 安排 ， 我 们 把 第 2 章 《 该 章 涉及 大 量 的 数学 描述 ) 中 出 现 的 
operation 主 柳 详 做 “运算 ”， 而 把 其 他 章节 中 的 operation 主要 稻 译 为 “操作 ”， 需 要 注意 的 是 ， 这 种 
划分 并 不 是 绝对 的 ， 


memory 5 storage 


memory 是 一 个 我 们 非 闸 熟悉 的 术 计 E， 我 们 一 般 把 它 习惯 地 称 为 “内 存 "。 但 是 ， 通 过 本 书 第 6 
ЖА memory 的 解释 来 看 ， 仅 有 这 样 的 理解 是 不 是 够 的 。 本 书 认 为 memory 可 以 是 不 同 容量 、 成 本 和 
访问 时 间 的 存储 设备 ， 我 们 过 去 所 认识 的 memory 只 是 DRAM. 所 以 ， 不 能 把 memory 简单 地 翻译 为 
"RET 

№ memory 和 storage 这 两 个 单词 的 中 交 意 思 来 看 ，memory E “ЖШ”, ІШІ storage R. “ (Е, 
仔 信 器”。 别 外 ， 我 们 还 观察 到 ， memory 更 多 地 以 名 词 出 珊 ， 搞 述 一 个 静态 的 物理 设备 ， 而 storage 
除了 可 以 作为 名 词 出 现 外 , 还 有 动词 前 形式 (store. storing 和 stored)。 所 以 ， 我 们 取 memory 的 中 文 
ERU Я”, ШІ storage (以 及 store. storing 和 stored) ATRAE “АН”, ЕҢ, i 
AF Aip, A memory 和 storage 问 时 出 现时 ， 我 们 除了 给 出 storage 的 中 文 释 义 外 ， 还 尽 可 能 地 
Нән Еа, Ц, Ы memory 的 区 别 。 


hazard 


Е-Е АРИЖЖЕ Ы ІН Жаа. CREP, ПАНЫ ЕХ НЕ” Жи]. 
我 们 在 做 学 生 时 , AM REFERER, 很 少 说 它 的 中 文 ， 选择 它 的 中 文 详 法 真 的 是 一 件 很 麻烦 的 事情 。 
曾经 有 一 个 网 友 告 诉 我 ， 他 看 到 一 个 “险象 ”的 译 法 比较 贴切 。 了 呵呵， 为 了 这 个 本 语 的 翻译 ， 我 和 他 
在 网 上 争论 了 商 天 。 仔 细 想 想 “ 险 得 ”这 种 译 法 ， 确 实 不 为 错 ， 但 还 不 能 完全 说 服 我 选用 它 ， 因为， 
这 个 释义 太 过 卫生， 许多 读者 可 能 无 法 联想 到 其 对 应 的 英文 单词 。 而 选用 “冒险 ”， 人 尽管 处 是 乾 么 完 
美 ， 但 是 大 多 数 斌 究 体系 结构 的 读者 会 很 熟 释 。 所 以 ， 对 “冒险 ”的 选用 只 是 一 种 当 惯 和 默认 。 


timer 


timer 的 中 文 释义 有 :“ 定 时 器 ， 计 时 器 ”。 尽 管 这 两 个 中 文 释义 都 可 以 描述 一 个 现象 ; IS ER 
时 间 后 产生 - -个 事 件 ， 但 是 我 们 认为 这 两 者 之 间 是 有 区 别 的 ,从 中 立 字 面 来 说 ， 定 时 器 芍 间 随 更 多 十 
固定 的 ， 休 “向 于 表态 性 :而 计时 器 的 间隔 更 多 是 不 辕 定 的 ， 有 计算 的 意思 ， 人 屈 问 于 动态 性 。 所以， 在 
Ж Ж 9 章 中 (该 章 主要 找 述 系统 评价 )， 我 们 主要 把 ume 翻译 为 计时 器 ， 而 在 其 他 章节 翻译 为 
是 时 器 。 


local 


local 的 中 文 释义 是 ;“ 本 地 ， 局 部 ”。 我 们 没有 严格 地 区 分 它 ， 完 全 是 根据 上 下 文 描述 的 方便 ， 
来 选用 不 同 的 释义 ， 

原 书 还 出 现 了 一 些 错 误 ,， 这 些 错 误 只 是 我 们 个 人 认为 的 ， 急 有 可 能 是 我 们 理解 错 了 。 所以， 我 们 
在 “ 莫 改 ”原文 的 意思 时 ， 还 尽 可 能 地 给 出 了 原文 的 意思 ， 以 帮助 读者 甄别 。 

我 很 宴 欢 这 本 书 ， 且 认为 它 的 内 容 在 5~10 年 内 都 有 它 存在 的 价值 。 但 是 ， 鉴 于 我 们 的 能 力 和 时 
间 有 限 ， 不 能 保证 完全 忠实 、 准确 地 重 述 原文 的 意思 ， 还 需要 广大 读者 的 支持 。 ЖГ Kusa (Llu 
本 书 的 时 候 能 积极 地 给 我 们 指出 其 中 错误 ,改善 此 书 的 质量 ,方便 后 来 的 读者 从 中 更 顺 物 地 获取 知识 。 


шон 


《深入 理解 计算 机 系统 》(Computer Systems: А Programmer's Perspective, CS: APP) 这 本 书 的 证 
要 读者 是 那 些 想 通过 学 习 计 算 机 系统 的 内 在 运作 而 提高 自身 技能 的 程序 员 ，。 

我 们 的 目的 是 解释 所 有 计算 机 系统 的 本 质 概念 ， 并 向 你 展示 这 些 概念 是 如 何 实 际 地 影 聘 应 用 程 
序 的 正确 性 、 性 能 和 实用 性 的 与 其 他 主要 针对 系统 构造 人 员 的 系统 类 书籍 不 癌 , 这 本 书 是 写 给 程序 
员 和 的 ， 是 从 程序 员 的 角度 来 描述 的 。 

如 果 你 学 习 和 研究 这 本 书 里 的 梳 念 ， 你 将 步 入 稀缺 的 “ 棚 感 程 序 员 ”的 行列 ， 将 知道 事情 古 如 
伍 运 作 的 ， 也 知道 在 出 现 故 障 时 如 何 进 行 修复 。 同时， 你 也 将 做 好 学 习 其 他 具体 系统 主题 的 准备 ， 比 
如 编 评 跨 、 计 算 机 体系 结构 、 换 作 系 统 、 嵌 入 式 系统 和 网 络 互联 。 


读者 所 应 具备 的 背景 知识 


本 书 中 的 范例 是 基于 英特尔 兼容 的 处 理 器 ‘英特尔 称 之 为 “IA32”"， 即 俗称 的 “x86”)、 在 Unix 
或 类 Unix 《比如 Linux) 操作 系统 上 运行 的 C 语言 程序 。( 为 了 简化 我 们 的 描述 ， 我 们 将 用 Unix 统称 
Solaris 和 Linux 这 样 的 系统 ,) 文中 包括 了 大 量 已 在 Linux 系统 上 编 详 和 运行 过 的 程序 范例 。 我 们 根 
设 你 能 访问 一 台 这 样 的 机 器 ， 并 且 能 够 登录 ， 然 后 做 一 些 诸如 收 改 日 录 之 类 的 简单 操作 。 

如 全 你 的 计算 机 运行 的 是 Microsoft Windows 系统 ， 你 有 两 种 选择 。 第 一 ， 获 取 一 个 Linux Ж 
N CEA www.linux.org 或 者 www.redhat.com)， 然后 以 “双重 启动 ”模式 安装 它 , 这 样 你 的 机 器 就 能 
运行 任 一 个 操作 系统 了 。 另 -种 选择 就 是 ， 道 过 安装 Cygwin 1A (www.Cygwin.com)， 你 就 能 在 
Windows К Ж 一 个 类 似 Unix 的 shell 以 及 一 个 非常 类 似 于 Linux 提供 的 环境 。 椒 过 ，Cyewin 并 不 
能 提供 所 有 的 Linux 功能 。 

我 们 还 假设 你 对 CA C++ 有 一 定 的 了 解 。 如 果 你 以 前 只 有 Java 经 验 ， 那 么 这 种 转换 将 需要 你 让 
已 付出 更 多 的 劳力 ， 丰 过 我 们 也 将 帮助 你 。Java ІС 有 相似 的 语法 和 控制 语 名 。 

НЕ, Н-ЕС 语言 的 内 容 ， 特别 是 指针 、 显 式 的 动态 存储 器 分 配 和 格式 化 VO, Java 中 都 是 没 
有 的 。 所 雷 的 是 ，C 是 一 个 较 小 的 语言 ， 并 且 在 Brain Kernighan 和 Dennis Ritchie AAJ “K&R” $ 
学 中 得 到 了 清晰 优美 的 描述 [40]。 无 论 你 的 编程 背景 如 何 ，K&&R SB kr A, СЕ Н — BET 

这 本 书 的 前 几 童 揭示 了 C 语言 程序 和 它们 相应 的 机 器 语言 程序 之 间 的 交互 作用 。 机 器 语言 示例 
都 是 用 运行 在 ntelIA32 处 理 器 上 的 GNU GCC 编译 器 生成 的 ， 我 们 不 需要 你 以 前 有 任何 硬件 、 机 器 
语言 战 是 汇编 语言 编程 的 经 验 。 


给 忆 语 穴 初 学 者 ， 关 于 C 编程 诺言 的 建议 


为 帮助 CC 语言 娘 程 篆 最 薄弱 的 (或 全 无 背景 的 ) 读 者， 也 为 了 强调 全 中 一 此 重要 特性 ， ana 
了 专门 的 注释 。 АЛИНКА Ж C++ Java, 


怎样 阅读 此 书 


从 性 序 员 的 角度 来 学 习 计 算 机 系统 如 林 工 作 将 非常 有 趣 ， 主 要是 轩 为 这 个 过 程 可 以 非常 主动。 大 
沦 何 时 你 学 到 一 些 新 的 东西 ， 部 可 以 马上 试验 并 旦 直接 看 到 运行 结果 。 叶 实 К. 我们 相信 学 习 系 统 的 
ПЕП А (do) 系统 ， 即 存 真 正 的 系统 荆 解 六 有 具体 的 问题 ， 或 是 编写 和 运行 程序 ， 

ЕЕЕ, МОА ARRSH, ЕЕЕЛНЕН ARENASA, RE БАК 
做 玉 检 验 你 的 悍 解 。 练 习题 的 解答 在 每 章 的 末尾 。 当 你 阅读 时 ， 堂 试 白 己 来 解答 每 个 问题 ， 然 后 本 查 
ЖЖ, Ed B ERI. 每 一 瘟 后 面 都 有 НЛ ЕЖЕН ЖЕРЛИ. IHE РЕНИН 
有 这 些 问 题 的 答案 。 对 每 个 家 庭 首 站 题 ， 我 们 标注 了 我 们 认为 的 准 典 级 别 ; 

„пе. JF ik ТР Ре. 

专 傅 可 能 而 监 将 近 20 MW. ЖЕМИНЕ ИНА GERE, ДЫН БИП ЖОН Н. 

ФФФНИЕЛЕЛІНЕЛ, БИЕ 1-2 个 小 时 ,一般 包 据 编写 和 测试 大 量 的 代码 。 

ФФФФ TE, гро 个 小 时 。 

OPE NIB BE SUE C 程序， 经 过 版 本 为 2.95.3 的 GCC 编译 并 在 内 核 版 本 为 2.2,16 的 Linux 
系统 上 测试 后 户 接 千 成 的 ， 没 有 任何 人 为 的 改动 。 所 有 洪 程 序 代 码 拘 吕 从 本 书 的 主页 Cesapp.cs.cmu. 
edu) 上 禾 联 。 在 交口， 潜 程 序 的 交 件 各 列 在 山 条 水 平 线 玖 右边 ， 水 平 线 之 间 是 格式 化 代码 。 比 如 ， 
图 Pl 中 的 程序 能 存 code/intro Н Т0) hello.c 文件 中 找到 。 我 们 鼓励 你 ， 当 通 到 这 些 示 例 程序 时 ， 
在 你 的 系统 上 试 试 运行 它 入。 


code/intro/hello.c 


i &include «56010.12 

2 

3 int majini) 

& | 

5 printiíí"he:*o, world*ir"'); 
5 } 


codeAntrofhelln.c 
&P.] 一 个 典型 的 代码 示例 


版 后 ， 有 此 部 分 (用 “*” 标 注 的 } 包含 了 一 些 你 可 能 会 觉得 有 趣 但 可 以 略 过 而 不 影响 阅读 连 员 
性 的 东西 。 


Eu. (AEG 

EARP, САНА S LUE AURA il PANWAR. Bde den ТТН АЯ 
SETH., ФАЖІАФЕН. EXdWAXGX, pd. C. Linux fe jntemet 是 从 何 而 来 的 ? 有 
Br. ЕЛЖ И] ЖЕҢ ЖП Ж CELEREM IRURE, Әк, dudo AH. dfe HEART 还 有 的 
BH, Fh TERARI, de, АНЕ LEE T EIS KAS, XA 
页 正 的 IBM HEUS BOE EAOGEAEARET. ЖБ. €f Ed EX M. piis, (AX 
*hoinky" ? 


ЫЕЕЕ КТК. BEA C 的 位 级 操作 来 说明 布 水 代数 的 原理 和 
应 用 。 我 们 人 只 如 何 表 示 浮 点 值 和 浮 点 操作 的 数学 属性 方面 讲述 IEEE ЖЕШ ra КД. 

对 计算 机 息 术 的 深刻 理解 是 写 出 可 靠 程 序 的 关键 。 比如 , 不 能 用 (x-y<0) ERR (х<у), 
因为 可 能 会 产生 澡 出 。 其 全 也 不 能 攻 表 达 式 (-y<-x)》 来 取代 ， 因 为 在 二 进 制 补 码 表 水 中 贷 
数 和 正 数 的 沌 围 是 不 对 称 的 。 算 本 溢出 是 程序 错误 的 一 个 常见 根源 ， 然 而 很 消 有 卡 从 一 个 各 
序 员 的 前 度 去 讲述 计算 机 算术 的 特性 。 
$33: 程序 的 机 器 级 表示 。 我 们 教学 生 如 何 读 由 CC 纳 译 器 生成 的 (A32 汇编 语言 。 我 们 说 
明 为 不 同 控制 结构 ， 比 如 条 件 、 循 环 和 开关 语句 ， 生 成 的 基本 指 今 模式 。 我 们 还 讲述 过 稳 的 
执行 , 包括 栈 分 配 、 寄 存 器 使 用 惯例 和 参数 传递 。 我 们 讨论 不 本 数据 结构 如 结 术 .联合 (union) 
和 数组 的 分 配 和 访问 方式 。 学习 本 章 的 概念 能 够 帮助 学 生成 为 更 好 的 程序 员 ， 因 为 他 们 懂得 
他 们 的 程 岸 在 机 器 土 是 如 和 何 表 未 的 。 另 外 一 个 如 处 在 于 学 生 们 对 指针 有 了 其 体 的 了 解 。 
第 4 章 : 处 理 禄 体系 丫 构 。 这 - 章 讲述 基本 的 组 合 和 时 序 轴 辑 元 素 ， 并 展示 这 些 元 素 在 数据 
Ви (datapath) "XB e $l--ia, ЖАН IA32 指令 集 的 -- 个 称 为 “Y86” 的 简化 子 集 。 
我 们 从 设计 单 时 钟 周 期 、 利 流水 线 化 的 煞 据 路 径 开 始 ， 然 后 扩展 成 一 个 五 阶段 、 流 水 线 化 内 
没 计 。 本 章 中 处 理 器 设计 的 控制 焉 辑 是 用 一 种 称 为 HCL 的 简单 硬件 描述 语言 来 描述 的 。 用 
HCL 写 的 而 件 设计 能 够 独 译 和 链接 成 本 书 中 提供 的 图 形 处 理 器 的 模拟 里 。 
® 5%: 优化 程序 性 能 。 在 这 一 章 里 ， 我 们 介绍 许多 提高 代码 性 能 的 技术 。 我 们 从 与 机 器 无 
关 的 程序 转换 开始 , 这 些 标准 是 在 任何 机 器 上 写 任 何 程序 时 部 庶 该 述 御 的 ， 然 后 是 那些 功效 
有 赖 于 日 标 机 器 和 编 评 器 特性 的 转换 。 为 了 促进 这 些 转换 ,我们 介绍 了 -个 简单 的 操作 模型 ， 
它 描述 了 现代 乱 序 《out-of-order) 处 理 器 是 如 和 何 工 作 的 ， 然 后 向 学 生 们 展示 怎样 利用 这 个 模 
Ter dH C 程序 的 性 能 。 
$63: 存储 器 层次 外 构 。 对 应 用 程 弃 员 来 说 ， 存 储 器 系统 是 计算 机 系统 中 最 直接 可 见 的 部 分 
之 --。 到 日 前 为 止 ,学 生 们 | 一直 认 同 这 样 一 个 存储 器 系统 概念 模型 ， 认 为 它 是 一 个 有 一 至 访问 
ЕНЕ ЕНЕҢ. ЕЕ, А РАР ТИІН АН. 造价 和 访 剂 时 人 间 的 存储 设备 组 成 的 
司 底 和 结构 。 我 们 讲述 不 同类 型 的 随机 存 取 存储 器 (RAM) НАЙТИ (ROM) 以 及 现代 磁 
ЖО) ЛИН ДАННЫЕ. 我 们 描述 这 些 在 情 设 备 是 如 何 放置 在 层次 结 拘 中 的 ， 讲 述 访 
问 局 部 性 扰 如 何 司 这 种 后 次 结构 成 为 可 能 的 。 我们 通过 个 独特 的 观点 使 这 些 理论 具体 化 、 W 
5, ДЕН ОАА М “Ха ЫП”, AERAR MARETIE. i 
后 ， ACT d ЕТ hr fe RISE E E [а] Fg RE PESCE e Rv R] REF PE НЕ. 

第 了 章 ; 链接 . 木 章 讲述 静态 和 动态 链接 ， 包 括 的 概念 有 可 重 定 位 的 【relocatable) Mt 
ITJ H EK X fF, SP SAEI. Есу (relocation), ЕЕ. EHRE, DE Su m AX 
HR. X XXUASUB TED RRE, mad FriJLTEDNEgGSE. Ж-. xU 
1 38 BI ETE ER I jn] E rR, ТЕНТА RRAK JL REDE US КИК ШЖ 
E. 4 o ЖЕЛЕ BIS, i. ЫЛА ЖЕН SS SIP КҮЙ; 
HRR 

第 8 章 : 异常 控制 流 。 在 课程 的 这 个 部 分 ， 我 们 通过 介绍 异常 控制 流 〈 比 如 ， 正 常 分 支 和 过 
程 调用 以 外 的 控制 流 变化 ) 的 一 般 概念 打破 单 -程序 的 模型 。 我 们 给 出 存在 于 系统 所 有 层次 
的 异常 控制 流 的 例子 ， 从 底层 的 谭 件 异常 和 冲突 ， 到 并 发 进程 的 上 下 文 切 挽 ， 到 Unix 信号 


本 书 的 起 源 


本 书 起 源 于 1998 ЧЫКЕ ИЕК ИЖЕ (CMU) 大 学 开设 的 一 门 编写 为 15-213 的 介绍 性 谋 
Bio TN uE 9976 (Introduction to Computer System，ICS》[71。 从 芭 以 后 ， 每 学 糊 都 开 没 7 了 ICS 
这 门 课 称 ， 每 期 有 150 名 左右 的 学 年 ， 太 地 数 是 计算 机 科学 和 计算 机 上 程 专 业 一 年 级 的 学 生 。 后 水， 
这 ] 奈 析 还 成 为 了 卡 内 其 梅 降 太 学 计算 机 科学 系 以 及 电子 和 计算 机 江 税 系 中 大 杀 数 冶 级 系统 深 程 的 
САТА, 

ІС ЖЛЕ S Pr ЖАНИ) Л АН rei tpl. 因为， 我 们 的 学 生 中 几乎 洲 有 人 有 机 会 
构造 计算 机 系统 。 男 一 方面 ,大 多 数学 生 ， 其 至 是 计算 机 工程 师 ， 也 要 求 日 常 能 使 用 计算 桃 各 编写 计 
算 丽 程 字 。 所 以 我 们 决定 从 程序 员 的 乔 度 来 讲解 系统 ， 并 玉 用 这 祥 的 过 滤 方 法 : 我 们 只 讨论 那些 影响 
H R СВЕДЕНО ВЕ. САТЕ Е АУ ЫЙ. 

tau, ВЕНИ ГАДЕЛ Ж БУРА, ШГЕК ГЛЕ и. НДА 
ТАНГ ЕН Weg. EX C RFEA. ИИИ ЗЕ ШИЕ E ШЙ 
WF ДЕП] EH OK (switch) БАЛЫ. Е, RUBEE 2 N ИН АЙ, ЮРЕК ТИЯ 
КЕЕ, ЖЕТЕР. да. GERE. fs. ERRE. Wik. UO 以 及 网 络 与 并 发 编程， 

XX o ЕНІН ICS RENA МН ЕЕ ЖЫ ЕЛ, Rk, ЖИШШ ӘР. ШЕГШДЕ НЕД АВ 
TERRE. (Rua, REKER KH ЕН ЖЕТЕН ТІНЕН cp. TE UR SL AS a ER E 
大 学 以 外 的 其 他 大 也 可 以 从 我 们 的 方法 中 获 荔 。 因此， 历时 两 年 , 这 本 书 从 ICS 课程 笔记 中 庶 运 而 生 
Ў. 


Ан, 5105 有 关 的 数字 

I ICS 课程 宵 关 的 数字 很 特别 。 在 第 一 学 期 过 半 的 时 候 ， 我 们 发 现 课程 的 编号 (15-213) 亚 好 就 是 
卡 内 基隆 大 学 的 邮政 编码 ， 因 此 ， 还 有 了 这 样 的 话 : “15-213: 给 予 卡 内 基 梅 隆 大 学 精神 的 课程 1” | 
ХЖ, ЗАНАД 2001 年 2 А 13 B (уз) PA. ШӘП SIGCSE* 教育 会 议 上 
介绍 这 门 课程 时 ， 被 安排 在 了 213 房间 ， 并 且 此 书 的 最 后 一 版 有 ARY, EAA TE! 


本 书 概述 


AHH 13 章 组 成 ， 骨 在 闸 述 计算 机 系统 的 核心 概念 ， 

* 第 ] 章 : 计算 机 系统 漫游 ， 这 - - 章 通 过 研究 “jhello, world” 这 个 简单 程序 的 生命 周期 ， 介 绍 
计算 机 系统 的 主要 概念 和 主题 。 

е #2%: 信息 的 表示 和 处 理 。 我 们 讨论 计算 机 算术 ,重点 拭 述 对 程序 员 有 影响 的 光 符 转生 
BERMI (twos complement) 的 数字 表示 法 的 特性 。 我 们 考虑 数 宇 是 如 何 表 示 的 ， 雇 及 出 
此 确定 对 于 一 个 给 定 的 字 长 ， 上 其 可 能 编 氏 值 的 范围 。 我 们 探讨 有 符号 和 无 符号 数字 之 间 类 型 
转换 的 和 效果， 还 阅 述 算术 操作 的 数学 特性 。 党 生 们 很 惊奇 地 了 解 到 (二进制 补 码 表 未 的 ) ИЯ 
个 下 数 的 和 或 者 积 可 以 为 负 ， 另 -方面 ， 一 进 制 补 码 算法 满足 环 的 特性 ， 因 此 ， 编 译 器 可 以 


| zp MA "Hf" df “Ей” 2Е.--НЕ 
2 SIGCSE 代表 Special Interest Group оп Computer Science Education， 计 算 机 对 学 教育 特殊 兴趣 组 ，- 一 - 译 者 


传送 引起 的 控制 流 突变 ， 到 CC 中 破坏 楼 原 刘 的 非 本 地 跳 转 nonlocal jump). 

在 这 一 章 ， 我 们 还 向 学 生 们 介绍 进程 的 基本 概念 。 学 牛 们 了 解 进程 是 如 何 : 二 作 移 ,以太 
如 何在 应 用 程序 中 创建 和 操纵 进程 。 我 们 内 他 们 展示 庶 用 程序 员 如 何 通过 Unix 系统 调用 使 
用 过 进入 。 掌 完 本 章 ， 他 们 就 能 辟 编 写 带 作业 控制 的 Unix Ж T. 

e 493%: 测量 程序 运行 时 间 。 这 - - 章 教 给 学 生计 算 机 是 邵 何 理解 时 间 的 [时 间 间 陋 计 时 器 、 
CPU 周明 计时 器 (cycle timer) 和 系统 时 钟 ]， 当 我 们 试图 用 这 些 时 间 溢 测量 称 序 运行 时 时 间 
的 错 谋 根源 ， 以 及 怎样 运用 这 些 知 识 来 得 刘 准 确 的 度量 值 。 据 我 们 所 知 ， 这 是 惟一 的 在 以 前 
还 末 以 任何 常规 的 方式 讨论 过 的 内 容 。 我 们 在 此 讨论 这 个 主题 是 因为 它 需 要 对 汇编 语言 、 进 
BIRRA N Г. 

е $103: 虚拟 在 鱼 性 。 我 们 讲述 虚报 存 赃 器 系统 是 希望 学 生 们 对 它 的 工作 和 特性 有 所 了解。 
我 们 想 让 学 生 了 解 为 什么 不 同 的 并 发 进程 各 自 都 有 一 个 相同 的 地 址 范围 ， 能 共 侍 某 些 页 ， 但 
朋 外 一 些 页 又 是 独占 的 。 我 们 还 覆盖 一 些 管理 和 操作 上 鹿 拟 站 人情 器 的 问题 特别 地 ， 我 们 可比 
了 存 铺 分 配 操 作 ， 比 如 Unix 的 malloc 和 free 操作 ， ЛЕЙ A H F FILI. € 
加 强 了 虚拟 存储 器 空间 只 是 学 节 数 组 ,程序 可 以 把 它 划分 成 不 同 存 储 单元 的 概念 。 守 还 助 学 
生理 解 包 售 有 像 存储 泄漏 和 非法 指针 引用 这 样 存储 器 引用 错误 的 程序 的 后 果 。 最 后 ， 许 多 谋 
用 程序 员 编 写 自 己 的 优化 了 的 存储 分 配 操 作 来 满足 应 用 程序 的 需要 和 特性 。 

* 第 jl $: 系统 级 DVO。 我 们 讲述 Unix VO 的 基本 概念 ,例如 文件 和 描述 符 。 我 们 描述 如 何 划 
Ftit. VO 重 定 同 是 如 何 上 作 的 ， 还 有 如 何 访 问 交 忻 的 元 数据 。 我 们 还 开发 了 一 个 健壮 的 
带 缓冲 瓜 的 TO 包 , 可 以 正确 处 理 short counts, ЖП Ж C 的 标准 VO 库 , UA; Unix VO 
ЮХА, ААИ TO 的 局 限 性 ， 这 此 局 限 性 使 过 不 适合 阿 络 网 程 。 总 地 说 来 ， 木 章 失 
论题 是 后 面 殉 章 网 络 和 并 发 编程 的 基础 。 

е 第 12 X: 网 络 编程 。 对 编程 而 言 ， 网 络 是 非常 有 趣 的 VO Ж. РЕЛЕ ХАН 2] 
的 概念 ， 比 如 进程 、 信 号 、 宝 季 顺 序 (byte ordering)、 存 储 器 映射 和 动态 存储 器 分 配 ， 联 系 
在 一 起 。 网 络 程序 还 为 并 发 提供 了 强制 性 上 下 文 ， 这 是 卜 - 章 的 论题 。 本 章 是 网 络 编程 的 细 
小 片段 ， 司 学 生 们 能 够 编写 Web 服务 器 。 我 们 还 讲述 位 于 所 有 网络 程序 底层 的 客户 疹 - 服 学 
器 模型 我们 展现 了 -个 程序 员 对 neme 的 观点 ， 并 且 教 给 学 生 们 如 何 用 套 接 字 (socket) 
接口 来 编写 Internet 宅 户 疾 和 骤 务 器 。 最 后 ， 我 们 介绍 超 交 让 传输 协议 HTTP， 并 开发 了 一 
个 简单 的 选 代 式 (iterative 》Web 服务 器 。 

. 第 13 章 ; ХАЖ. СЕЙ Internet 服务 器 设计 为 例 向 学 生 们 介绍 了 并 发 编程 。 我 们 比较 
对 照 了 三 种 编写 并 发 程序 的 基本 机 制 GER. VO ЯНЕ КИН), ИЛАН 
它们 来 建造 并 发 Internet 服务 器 ， 我 们 探讨 了 用 Р. у 信号 操作 ， 线 程 安全 和 可 重 入 
(reentrancy)、 问 争 条 件 以 及 死 锁 等 来 实现 同步 的 基本 原则 。 


可 以 基于 本 书 的 课程 


指 寺 教师 可 以 使 用 本 书 来 教授 五 入 不 同 的 系统 课程 (图 P2)。 REPERI CT URP E.P 
估 硬 位 、 学 生 的 背景 知 能 力 。 图 中 的 课程 从 左 往 石 ， 逐 渐 强 诈 以 程序 员 的 角度 着 待 系统 ， 以 下 是 简单 
的 描述 : 


. ORG: -[j dL fear ERE ВЕН А IR НЕТ. PESE] ЕЕ ЕНЕ НҮ, 
НАНЫ. ТЕН ЛЫН ЖЫ. ЖАШ. wid Дн л] КЕГИ у ЩН. ЖИГ, 
ж ЖЕ ЛА СН. FEIK ЫР АПШ ИЛЛ НЕ OK e C 1889. 

е ORG+: ORG ЇЙ К РАУ Н {ЕРЕЕН Ж. A ORG 课程 相 比 ， 学 生 要 下 多 地 
s JSK LR] ERR СЕЛЕ ЕРЕ AR TERE 

е [CS 其 本 的 ICS 课程 ， 则 在 培养 开 曲 的 程序 员 ， 他 们 型 解 硬 件 、 操 作 系 统 和 编 详 系 统 对 应 
用 程序 的 性 能 和 正确 性 的 影响 。 和 ОКО РЕ Ч А е, ОЛЧЕ ЛАКА ЯКЕ ак 
体系 结构 。 相 反 地 ， 程 序 员 与 现代 乱 序 处 理 器 的 高 级 模型 打交道 ，ICS 课程 非 浓 适合 实 排 成 
— 10 周 的 学 期 ， 如 果 步 调 上 囊 从 容 一 些 ， 所 可 以 延长 为 一 个 15 周 的 学 期 。 

. ICS+: 基本 的 ICS 课程 ， 额外 论述 一 些 系统 纲 程 问题 ， 比 如 系统 级 VO. MEETS BUT Y O 
程 ， 这 基 一 门 一 学 期 长 虐 的 卡 内 基 梅 隆 大 学 课程 ， 会 讲述 本 书 中 除了 低级 处 理 器 体系 结构 以 
外 的 每 一 章 。 

* SP; ” 门 系统 编程 课程 。 程 ICS+ 课 种 相似， 但 是 抛弃 了 浮 点 和 性 能 优化 ， 更 如 强调 系统 网 
种 ， 包 拓 进 称 控 制 、 动 态 链接 、 系 统 级 VO. НИЕ. BREED пу ЯЕ АЕ ЛА Д 
他 渠道 村 某 些 高 级 论 夯 做 些 补充 ， 比 如 守护 进程 《daermon)、 终 端 控制 和 Unix IPC. ОЗІН 
ШЕ). 


系统 漫游 
数据 表示 
HL dei n 
Er Ж ИЖЕ 
КЕҢ. 
GE IZ II 


SE 

异常 控制 流 
ЕТЕЙІН 

Г КЕГЕН ET 
系统 级 VO 
网络 编程 

并 发 编程 





图 P,2 五 门 基于 本 书 的 课程 
HE: GO АО, (b) atiyku Сс) ХЕ GD ХЕ. КӨНЕР ЕНІН 15-213 IRR. 


A P.2 监 表达 的 主 归 信 息 是 本 书 给 了 你 多 种 选择 。 如 果 你 希望 你 的 学 生 更 多 地 了 解 低级 处 理 器 体 
AB. ЖАД ORG 和 ORG+ 课 程 可 以 达到 日 的 。 另 一 方面 ， 如 果 你 息 将 当前 的 计算 机 组 成 诛 称 
RR ICS 或 者 ICS+ 课 程 , 也是 又 担心 突然 做 这 样 码 烈 的 变化 ,那么 你 可 以 笑 步 递增 转 癌 ICS 课程 。 
(кара А OGR 课程 开始 ， 它 以 种 非 传 统 的 方式 教授 传统 的 问题 。 一 下 你 对 这 些 内 容 感 到 驾轻就熟 


f. ЖАЙНА ЖГ ORG+， 最 终 转 到 JCS， 如 果 学 年 没有 C 的 经 验 【比如 他们 只 用 Java eb BU), di 
站 以 花 儿 周 的 时 间 在 C 上 二， 然后 再 讲述 ORG 或 者 ICS ERA 

En. 我们 认为 ORG+ 和 SP 课程 适合 安排 为 两 期 《了 两 个 季度 或 音 阿 个 学 期 )。 或 者 你 叮 以 将 虑 按 
Hm .期 JCS 和 一 期 SP 的 方式 来 教授 ICS+ 课 程 。 


课 党 测试 的 实验 练习 
上 内 基 梅 隆 大 学 的 ICS+ 课 程 得 到 了 学 生 们 很 高 的 评价 。 这 门 课 的 中 值 分 数 -- 般 为 5.0/5.0， 平 均 


分 数 一 般 为 4.6/5.0。 学 生 们 表扬 说 这 门 课 非常 有 趣 ， 令 人 人 兴奋， 证 要 就 是 因为 相关 的 实验 练习 。 下 面 
是 本 书 提 供 的 一 些 实 验 的 示例 。 


数据 实验 。 这 个 实验 柴 求 学 生 们 实现 简单 移 逻 辑 和 算术 消 数 ,但 是 只 能 使 用 个 商 度 受 限 的 
C 的 子 集 。 比 如 ， 他 们 必须 只 能 内 位 级 操作 来 计算 一 个 数学 的 绝对 值 。 这 个 实验 帮助 学 生 们 
T W C 数据 类 型 的 位 级 表示 ， 和 数据 操作 的 位 级 行为 。 

АНЕ, 二进制 炸弹 是 个 作为 日 标 代码 文件 提供 给 学 生 们 的 程序 。 运 行 时 ， 它 提 
AH PURA 6 个 不 辐 的 字符 串 。 如 果 其 中 的 任何 一 个 不 正确 ， 炸 阐 就 会 “爆炸 ” 打印 出 一 
条 错误 信息 ， 并 用 在 分 级 Cgrading) 服务 器 上 记录 事件 日 志 。 学 生 们 必须 通过 对 种 序 反 汇 旨 
АТОЙ [ау С Је УТЕ б УЕ, ДАЕ ИА ВЕНЕ Е, Тез О Е Н. 
编 诺言 ， 并 且 强 制 他 们 学 习 怎 样 使 用 调试 器 。 

Hr pL Ж 它 要 求学 生 们 通过 研究 - -个 缓冲 区 流出 的 错误 ， 来 收 改 二 进 制 叮 执行 文件 
的 运行 时 行为 。 这 个 实验 教会 学 生 们 栈 的 原 惠 ， 并 让 他 们 了 解 到 写 那 种 易于 遭 受 缓冲 公 滋 出 
攻击 的 代码 的 危险 性 ， 

体系 结构 实验 。 第 4 章 的 几 个 家 庭 作 业 问 题 能 够 组 合成 一 个 实验 作业 ， 在 实验 中 ， 学 生 们 修 
以 处 理 器 的 HCL 描述 以 增加 新 的 指令 、 偿 改 分 支 预测 策略， 或 者 增加 或 笛 除 芝 路 路 径 和 寄 
存 器 端口 .设计 出 来 的 处 理 器 能 够 被 模拟 , 并 通过 运行 自动 化 测试 检测 出 大 多 数 可 能 的 错误 ， 
这 个 实验 使 学 生 们 能 体验 到 处 理 器 设计 中 令 人 激动 的 部 分 ， 而 不 需要 他 们 学 习 和 建造 用 
Verilog 或 者 VHDL 语音 写 的 复杂 而 低级 的 模块 ， 

性 能 实验 。 学 生 们 必须 优化 应 用 的 核心 函数 (比如 卷 积 积分 或 矩阵 转 置 ) 的 性 能 。 这 个 实验 
尼 沉 清晰 地 表明 了 高 速 缓存 的 特性 ， 并 给 学 生 们 低级 程序 优化 的 经 验 。 


shell 实验 ,学 生 们 实现 他 们 自己 的 带 有 作业 控制 的 Unix shell 程序 , 包括 ctrl-c 和 ctri-z 按键 、 


fg. bg 和 jobs 命令 。 这 是 学 生 们 第 一 次 接触 并 发 ， 并 且 让 他 们 对 Unix 的 进程 控制 、 信 和 号 和 
信号 处 奸 右 清晰 的 了 解 。 

malloc 实验 。 学 生 和 们 实现 他 们 自己 的 malloc, fre 种 realloc 【可 选 地 ) 版 本 。 这 个 实验 让 学 
后 们 请 断 好 理解 数据 的 布局 和 组 织 ， 并 且 要 求 他 们 评估 时 间 和 空间 效率 的 各 种 权衡 和 折 中 ， 
代理 买 验 。 学 生 们 实现 一 个 位 于 训 览 器 和 万 维 网 其 他 部 分 之 间 的 并 行 Web 代理 , 这 个 实验 问 
FPR У Web 客户 端 和 服务 器 这 样 的 问题 , НЕА T RR PE BUE. the t 
序 、 文 件 WO、 进 程控 制 、 人 入 号 、 信 号 处 型、 存储 器 映射 、 富 接 字 和 并 发 。 


本 书 的 教师 手册 有 对 实验 的 详细 讨论 ， 还 有 关于 下载 支持 软件 的 说 明 ， 
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2 第 1 章 


计算 机 系统 是 由 而 忻 和 系统 软件 组 成 的 , 它们 共同 工作 来 运行 应 由 稳 序 。 明 然 系 统 的 肌体 实现 方 
式 随 者 时 间 不 断 变化 ,但 是 系统 内 在 的 找 念 却 治 有 改变 .所 有 计算 机 系统 都 由 相似 的 硬件 和 软件 组 成 ， 
它们 允 热 行 着 相似 的 动能 。 这 本 书 是 为 这 样 一 些 程序 员 而 写 的 ,他 们 着 望 通过 了 解 这 些 部 件 如 何 工 作 
以 及 如 何 影响 程序 的 准确 性 和 性 能 ， 来 提高 白 身 技能 。 

你 现在 就 要 开始 -次 有 趣 的 漫游 历程 了 。 如 里 你 全 力 投 和 里 学 习 本 书 中 的 概念 ,理解 底层 计算 机 
系统 的 本 质 和 它 如 何 影 响 你 的 庶 用 程序 ， 指 么 它 将 指引 你 步 上 成 为 稀缺 的 “权威 程序 员 ” 的 道路 。 

你 将 开始 学 习 一 些 实践 技巧 ,比如 如 伍 避 免 由 计算 机 表示 数字 方式 引起 的 奇 性 的 数 子 错误 。 你 将 
学 会 怎样 通过 一 些 蒋 上 明 的 小 窒 门 来 优化 你 的 С 代码 ， 这 些小 穿 门 运用 了 现代 处 嵌 器 和 存 赃 由 
(memory) 系统 的 设计 。 你 将 了 解 到 编译 峰 是 如 何 实 现 过 程 调用 的 ， 并 且 了 解 到 如 何 利 用 这 个 知识 
来 避免 纪 泪 区 溢出 错误 带 来 的 安全 漏 湘 ， 这 些 错误 给 网 络 和 Internet 软件 带 来 了 巨大 的 麻烦 。 你 将 学 
VIRA VURUEE БЕНЕН] ES, E ШІН үя, 它们 困扰 大 普 通 的 程序 员 , 你 将 学 会 如 何 编号 自己 的 
Unix shell、 上 自己 的 动态 存储 分 配 包 ， 其 至 于 自己 的 Web 服务 器 ! 

在 Kernighan ЖІ Ritchie HA F C AEn HAREMO, ALEE ІЛ 中 所 示 的 hello 3 
РЕЖ ИЛ С. 尽管 hello 程序 是 一 个 非常 简单 的 程序 ， 但 是 为 了 完成 它 的 执行 ， 系 统 的 每 个 证 
可 组 成 部 分 都 击 昌 协调 上 作 。 从 某 种 意义 上 来 说 ， 本 书 的 目的 就 是 划 帮 助 你 了 解 妆 你 在 系统 上 执行 
hello 程序 时 ， 系 统 发 生 >“ 什么 以 及 为 什么 会 如 此 运作 ， 

codefintro/hello.c 
Kinclude «stdio.h» 


{ 


1 

2 

3 int main:) 

d 

5 printfi"hello, woridin"); 
б} 


code/inrrorhello.c 


图 1.1 helo 程序 


ЛАН hello 程序 的 生命 周期 来 开始 我 们 对 系统 知识 的 学 习 ， 它 的 生命 周期 从 它 被 程序 员 
创建 开始， 包 失 在 系统 上 运行 、 输 出 简单 的 消息 ， 然 后 终止 ,我 们 将 沿 着 这 个 程序 的 生命 周期 ， 简 村 
地 介绍 一 些 悉 步 出 现 的 关键 概念 、 专 业 术 语 和 成 分 。 后 面 的 章节 将 填 绕 这 些 内 容 展 开 。 


іл 信息 就 是 位 + 上 下 文 


我 们 的 hello 和 序 的 生命 是 从 “个 源 程序 《成 者 说 源 文件 】 开 始 的 ， 该 源 程 序 由 三 序 员 通 过 编辑 
Жи {жн А ЖЖ, 文件 名 就 是 hello.c。 源 程序 实际 上 就 是 一 个 由 0 ЖЕК СМЖ АЩ 
RO 序列 ， 这 些 位 被 组 织 成 8 个 一 组 ， 称 为 字 节 。 每 个 字 节 部 表示 程序 中 某 个 京 本 字符 。 

大 部 分 的 坝 代 系统 都 使 用 ASCI 标准 来 表示 文本 字符 ， 这 种 方式 实际 上 就 是 用 一 个 惟一 的 字 节 
大 小 的 整数 值 来 表示 每 个 字符 。 比 如 ， 图 1.2 中 给 出 了 helloc 程序 的 ASCI de. 

hello.c 程序 是 以 字 季 序列 的 方式 情 存 在 交 件 中 的 。 每 个 字 节 部 有 一 个 整数 值 ， 对 应 于 某 个 字符 ， 
例如 ， 第 一 个 字 节 的 整数 值 是 35， 它 对 应 的 就 是 字符 “#"”。 第 二 个 字 节 整 数值 为 105， 它 对 应 的 学 符 


IE 217, ШИЖ. 注意， 每 行文 本 都 是 以 一 个 看 不 见 的 搁 行 符 "a ЖЕШ. ЖАПЕ 
为 10. [Ë hello.c 这 样 只 由 А8СП ЕНШЕ ЕРЕК Ж ЖЯ, PTH YI T ЕЕЗ Sb k, 


в і n c 1 ü d a «арх < B t d i ü ë 
15 105 110 88 108 117 100 101 32 ЕП 115 116 140 105 111 4 
^ > in п í n t «вр» т a 1 г i | wn | 
104 bz 10 10 105 110 116 12 3105 87 109 110 4 10 123 
ма <яр> «sp» «gp» «up» p r 1 fi t Ё | һ х 1 
а — 32 ia 32 3132 112 114 105 110 116 102 40 34 104 101 108 


ü r HDR ы б r l d [1 à | 


108 111 44 32 119 111 114 108 100 8% 110 14 41 54 10 125 
81.2 Һас ifj ASCI ЖТ 


hello.c 的 表示 方法 说 明了 一 个 基本 的 思想 , Rp a n Ea ep. ТЕРМЕ 
W. 存储 器 中 存 让 的 用 户 数 据 以 及 网 阁 上 传 北 的 数据 ， 都 是 由 一 帅 比 特 表 示 的 ,区 从 不 同 数据 对 曾 的 
惟一 方法 是 我 们 读 到 这 些 数 据 村 象 时 的 上 下 立 。 比 如 ,在 不 同 的 上 下 交 中 ,同样 的 字 节 序 到 可 能 雪 示 
“ЕШ. IRAN. THESE, 
FARTA, ЖЖЖ Т WS AH BEI, IN ET15 Un Sa mamam ep. ТЕП 
有 些 相 羽 ， 伯 这 圳 相似 井 不 为 人 所 知 。 这 方面 的 基本 原理 特 在 第 2 3e pH HG. 
Sut, CARRE 
СТАН тетю Dennis Ritchie + 1969 &- 1973 2844. ve 
ican Nationa Institute, ANSI) Æ 1989 4-965 T ANSI СЖЖ. doo EXT C 
+ =—Ю нд. "Haa Chit. Kernighan 和 Ritchie £ 4&1] ЕИ B] Ae dj 6 А EHE "KR" 
[40] P4 7 ANSIC. Fl Ritchie НАЗ, cA Ue. Жаны, ЕЕЕ Е". 
345 30 di nba 
s C5Unix MER iE X A dH, САЯ 如 是 作为 一 利用 于 UNix Айал ЕЕ Ж. 
Unix Fidi i dnd. LARE E HET ИБА CT ARR. 20468 70 AA 
后 期 到 DAREM, Unix АРТ AFER Je FR EA 1 WERS 国 为 Unix JL 
平 全 部 是 用 САХ, CARA HOA AN ‘BE, ШАЮ C 和 Unis ART 
# 3 ito kj. 
€ С-Н. с 语言 的 设计 是 由 一 个 人 而 非 一 个 协会 掌控 的 ， 其 ида 
А-Т. ЖААЛ НАН, как LEAN тиити лш тас 
ETARE, Sed 61 w. СЕНИМИ МУТАТ, +. [ 
TE Е. 
. CES XII. CAREA KL Unis IER LA, яй. 内 他 人类 用 过 
ЕЕ k ttika ПАН kaji, i 
санашып, RAE AEREN PANULE. H^. È HER ERE 
d 68 ые. С ELANG eHh LE. Ян, сажен 6 


ЖАКЕ ЕН. bk. қақ, И е Nur НИЕТ 
ЖЕНИ. 
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12 程序 被 其 他 程序 翻译 成 不 同 的 格式 


f£ hello 程序 生命 辕 其 的 一 开始 时 是 一 个 商 额 万 程序， 因为 当 目 FAHER ERRERA 
ЖИ. ЖІП. JU ТЕЕ FiETT helloc RITE, Bk C AEk CABE ГЕНІ, -EARE 
HAREA. BER НЕ УГАРА LA Cexecutable object program) 的 格式 
TIE, НЫИСИМИНТЕМЕЖІННІЕЖ. НЕЕ RR T UIS kit (ехесіндіме object 

在 Unix ЖЕР, GRE PESLH BOE EUR ERE HI SERE d Ж Lcompiler driver) FERRI]: 

unix» gcc -o hello hello.c 

ША, рос К КЫР ЕЕЕ ETEY вео с, HEERE E ETAIT ВБЕРЕ hello. 
ХА Р РА РА ЦВЕ ЕА В), ШЕ 13 Bim. ФАЛА ТВЕР CORE B. dh E. 
CARPE) ЕЮ ГАФ. 





13 жка 

s HEERE. ИЕН (cpp) НОННИ Йе (йтеспусь!. ЕНІН c BE. 
 @һейо.с 中 第 一 行 的 #inelude <stdio h> B $ 3; VERI AFER ЕҢ ЖЕУ fF stdioh f] iA $E. 
并 把 它 直 质 插 入 到 程序 文本 中 去 。 周 果 就 得 到 了 另 一 个 已 程 序 ， 通 常 是 以 i 作为 立 件 扩大 
Ж. 

* ЖЕНИ. PERS (сі) ЖЖ ЖТР hello ШК ЖИ bellos, CUA ALA 
A. 汇 志 语言 程序 中 的 每 条 语句 都 以 一 种 标准 的 立 二 格式 确切 地 描述 了 一 条 低 旺 机 器 语言 指 
付 。 谍 贺 讲 言 是 非常 有 用 的 ， 因 为 它 为 不 同 高 级 语言 的 不 同 编译 器 提供 了 通用 的 输出 语 计 。 
ш. c ШР Fortran Ж ТЁРЕ ЕШ НИ ЖЕШКЕН. ЕЕС Е ТГ. 

САН. 接 下 来 ,汇编 器 as) 将 hellos ЖЕНЕН ГИН, АНАТ аа у R 
ШИ "Г d$ (relocatable ) E Kol [5k at. ны {ЖЛЕ НЕЛЕ hello Ch. hello.o 
ЗЕ Gp ЕНТТЕНЕН АНЕ IS, ШЕЛ dcos 
"PITE helloo X PF, 8H IE НЕЗ. 

" МИКА. WIEN. RIO bello 程序 调用 了 міні 函数 ， 它 是 标 准 C А-Я, d 
ЛС КЕНЕНИ. pimi 函数 存在 于 一 个 名 为 Printfo T] ia IRURE НІКІ, ik 
X PEDIR ELRCM ГС АЛЖЫП hello.o 程序 中 ,链接 器 (ld) 就 角 表 处 再 这 种 并 入 ， Ж 
ЖИЕ! hello X fF, Х-ті (ШЖ), sp m iH 
fH. НЕНІ ВНТ. 


ж, GNU 项 目 | — 42 

ОСС Ж GNU (GNU 是 GNU's Not Unix M 5) JH FX h kak SAP r К+ —. GNU 项 目 
X. 1984 年 由 Richard Stallman Ж añ — - 8 86 AER. ЖАНЫН ЖЖЖ. RAR ORO + 
完整 的 类 Unix HRR., ЗАНЕ ФАННИ ЯЬ AE. 112002 3. GNU Жїнї 
为 一 个 Unix 84 K iki ИЖ dep HH ЖЕНЕН. шан, 内 村 是 由 Lim 5 R k + Б} 
H. GNU UE 646 EMACS EE. GOC 编译 器 ，GDB ARS. LHE. HAR., A Жа 3 аа 
的 工具 以 及 其 他 一 些 部 忻 ， 

GNU ЖЕ КАТ ЕЛА KM, {е4 ШЕКИЛ. ШАА SR GB 【通常 和 Linux 联系 在 一 
起 ) 的 思想 起 源 蚌 GNU ЯН P Ë dde 4e (free software ) 的 概 者 [此 处 的 fre 为 自由 言论 [ тее speech ) 
T "Bi Ld. ARRERA (irebe ç "f" xd. 5B. Linux ECET Ж k R KAA t 
We k T GNU r AL. £418 Linux EET Ий. 
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13 了 解 编译 系统 如 何 工作 是 大 有 益处 的 


ТЕ hello. SERRAR RU TRT ELI RR ЖЕ ЕЕЕ ЕКЕ. 但 是 ， 有 一 
ЖЕШ Tl b 2 S PE Tapa НЕ Ж БИЕШ NE; 

А Нн. ЕСА ЕНА, АГЕ ЕРНАР А, mi 
АЯТЕН ЕЕ T ИЙНЕК НЕТ HE, НЕ, ГИНИ C 程序 中 做 也 好 的 
FEES BE, 我 们 确实 需要 对 iL B EL RUE f em n i C 语句 转化 为 汇编 评 言 有 一 些 
EERTE. Ein — switch 语句 是 不 是 总 是 比 一 系列 的 证 ther_elae 语句 高 效 得 者 ? 一 个 
КИЙНКИ EC? while MEHE do АНЕ? 指针 引用 比 束 组 索引 更 有 效 吗 ? 相 
寺 于 用 通过 引用 心 递 过 来 的 需 数 求 和 ， 为 什么 用 本 多 变量 求 和 的 社 环 ， 关 运行 就 全 快 得 事 
ДЕ? ЖАРҒАН УИШН ЕЕ Т ИН КЕН? 

(ES З ер, ГОРА Intel A32 ҚЫТ, ЕА ЕА ШИГЕ Н] С 秩序 类 
的 乔 详 成 机 器 语 吉 的 。 在 第 5 章 中 ,你 将 学 习 如 何 通过 对 С Қонады, mui s 
下 时 地 之 成 工作 ， 从 而 调整 你 的 安 程 序 的 性 能 。 姨 后 在 第 6 章 ， 你 将 学 习 存 全 器 系 炭 的 屋 次 
特性 , C 编译 器 是 如 何 将 枝 组 存放 在 存储 器 中 ， 以 及 你 的 已 程 序 又 是 如 何 能 扔 利用 这 些 虽 识 
从 而 更 高 新 地 运行 ， 

. Ж МНЕ ЕНЕН. WERTHER. ES 4e A IB DOR Fe el EE EET SHE M P 
有 英 ， 苑 项 是 当 你 试图 建立 大 型 的 软件 系 绕 时 。 比 如 ， 链 接骨 报告 说 它 无 法 解析 一 个 引用 。 
BERI AAT Make RE SERES ЫЫ? 如 困 你 在 不 同 的 С Кіре зТЕЗ 
相同 的 两 个 全 局 变量 全 过 生 慎 和 ins PERO s PERLE EA FREIE Hz E 
排列 库 的 顺序 是 有 三 响 的 ? 最 为 烦人 的 是 ， 为 什么 有 些 链 接 异 误 直 到 运行 时 才 出 现 ? gm 7 
т, e TREE EIN IL ERE, 

(GE EPI. LFX, Ho [A d de RO T A £ PER ROI [ntemet ШШ LU ede. 
КЕН ИЙЕМ C РШЕ ШИ ТЕЛ Ж АЕ КОЕ ЕКЕ HERUM. E 
Айаан BEDS. REIS 3 ЖЕН НИШ N, 
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14 处 理 咽 读 井 解释 依存 在 存储 器 中 的 指令 


此 刻 , BAC] hellor ЖИНЕП НЕ ЖЫНЫН Т ПДТ Н+ halla。 并 被 存放 在 磁盘 上 。 
为 了 在 Unix Ж ЕТ ТЕН ПЕНЕН ШВАНН shell 的 占用 程序 中 

unix» ./hello 

hello, world 

unix» 

shell R — Ihr pir W, ЕНН Ут, НН А ре, Mundi Йй +. m 
W cm HTC HP RE — IP Ж shell r+, 35. shell E Tu RIT E PERLE. 
Eid RM ETUR EFE. ВЕДЕ ЈЕНИ НР, shell ЖП ROJA FT bello ИТЕ. RESH. hello 程序 
{ШЕЕ КИНЕ А. WESE. well Bi Н HAE. HT TREE T. 


14.1. 系统 的 硬件 组 成 

为 了 了 解 运行 时 helo 程序 发 生 了 什么 ， 我 们 需要 理解 一 个 奥 型 系统 的 硬件 组 织 ， 如 图 1.4 所 示 。 
这 张 图 是 Ite] Pentium 系统 产品 族 的 芥 型 , 但 是 所 有 其 已 系统 也 有 相同 的 外 现 和 特性 , 现在 不 要 担心 
这 张 图 很 复杂 一 一 我 们 将 在 贡 穿 这 本 节 的 课程 中 分 阶段 介绍 大 量 的 细节 。 












капи (uH 


FEA ШЕ 
SETUP de D HG 


"rapis if лего 
ШЕРЛІ ЕЁ 


图 1.4 一 个 典型 系统 的 硬件 组 成 
CPU, ЧЕЙ ALU: neu x. PC; ИНЕНІ, USB. Aunt nm. 
总 线 
DFE TRENE- AETH FASA CATARA ТТЕ NG ЖЖ BR 
КЕЗІНЕ ЕРІНІ, WERF (wod) Tre ve (FE) @#—4-ЖЖИ ЖЕШ. 4 


计算 机 票 统 漫游 7 


个 系统 中 也 不 尽 相同 。 比 如，Intel Pentium ЖН 4 £ W, 而 服务 器 类 的 系统 , 例如 Intel Ttaniums 
和 高 端的 Sun 公司 的 SPARCS 的 字 长 为 8 m. ШЕЕ ШТАН КАД Ж 2. 2830] E] 3550 Pil 
EPHEBRSTIES. ST THESE. RATBEEEXS AES. АБЕН, 


VO 设备 

LO (输入 /输出 } 设备 是 系统 与 外 界 的 联系 通道 。 我 们 的 示例 系统 包括 四 个 VO 设备 ， 作 为 用 户 
输入 的 键盘 和 鼠标 ， 作 为 用 户 输出 的 显示 器 ， 以 及 用 于 长 期 存 情 数 据 和 程序 的 磁 捞 驱动 器 《简单 地 说 
就 是 磁盘 )。 最 开始 ， 可 热 行程 序 hello 就 放 在 磁盘 上 。 

每 个 TO 设备 都 是 通过 一 个 控制 器 或 适配器 与 IO 总 线 连 接 起 来 的 。 控 制 器 和 适配器 之 间 的 区 划 
主要 在于 它们 的 组 成 方式 ,控制 器 是 IO 设备 本 身 中 或 是 系统 的 主 印 制 电路 板 《〈 通 攻 被 秘 信 主板 ) 上 
ЖӘЕ, ТӘНІ RE ЕЕ Е-Е. ЖӨН, ПЕ ЕЕ ЕНЕ VO 总 线 和 LO 设 
# Z net m. 

第 6 章 会 更 多 也 说 明 磁 盘 之 类 的 TO АЛЫ ГЕН. ЖЕН Б, Hole ЛИЯ 
序 中 利用 Unx VO 接口 访 和 疝 设备 。 我 们 龙 其 关注 特别 有 趣 的 阿 络 类 设备 ， 不 过 这 些 技术 也 适用 于 其 
他 设备 。 

主 存 

主 存 是 一 个 临时 存储 设备 , 在 处 理 器 执行 程序 时 ， 宅 被 用 来 存放 程序 和 程序 处 理 的 数据 。 物理 上 
来 说 ， 主 存 是 由 一 组 DRAM (动态 随机 存 取 存储 器 } 芯片 组 成 的 。， 逻 辑 上 来 说 ， 存 储 器 是 由 一 个 线 
性 的 字 节 数组 组 成 的 ， 每 个 字 节 都 有 自己 惟一 的 地 址 〈 数 组 索引 )， 这 些 地 址 是 从 堆 开 始 的 。 一 般 来 
说 ， 组 成 程序 的 每 条 机 器 指令 都 由 不 定量 的 字 节 槐 成 与 C 程序 变量 相对 应 的 数据 项 的 大 小 是 根据 
类 型 变化 有 的。 比如， 在 运行 Linux 的 Intel 机 器 上 ，short 类 型 的 数据 需要 2 字 节 ，int、float 和 long Ж 
型 则 需要 4 字 节 ， 而 double 类 型 需要 8 字 节 。 

第 65 章 只 体 说 明 存 储 技 术 , 比如 DRAM 是 如 和 何 工作 的 ,以 及 它们 又 是 如 何 组合 起 来 构成 主 存 的 。 


Rb RETE 

中 央 处 理 单元 《CPU) 简称 处 理 器 ， 是 解释 〈 或 执行 ) 存 情 在 主 存 中 指令 的 引擎 。 处 理 器 的 核心 
是 一 个 被 称 为 程序 计数 问 (PC) 的 字 长 大 小 的 存储 设备 【或 寄存 器 )。 在 任何 一 个 时 间 点 上 ，PC 都 
指 癌 主 存 中 的 某 条 机 器 语言 指令 【内 会 其 地 址 )， 

从 系统 通电 开始 ,不 到 系统 断 电 ， 处 理 器 一 直 在 不 假 思索 地 重复 执行 相间 的 基本 任务 ， 从 程序 计 
Жый (PC) 指 问 的 存储 器 处 读 取 指令 ， 解 释 指 令 中 的 位 ， 执 行 指令 指示 的 简单 操作 ， 然 后 更 新 程序 
计数 器 指向 下 一 条 指令 ， 而 这 条 指令 并 不 一 定 在 存储 器 中 和 刚刚 执行 的 指令 相 邻 。 

这 样 的 简单 操作 的 数目 并 不 多 ,它们 在 主 存 、 寄 存 器 文件 (register file) 0X ЖЕҢ A (ALU) 
ZM. 寄存 器 文件 是 一 个 小 的 存储 设备 ， 由 一 些 字 长 大 小 的 寄存 器 组 成 ,这 些 寄 存 器 每 个 都 有 惟 
一 的 名 字 。ALU 计算 新 的 数据 和 地 扯 值 。 下 面 是 一 些 箱 单 操作 的 例子 ，CPU 在 指令 的 要 求 下 可 能 会 
执行 这 些 操 作 ， 

. 加 载 ， 从 主 存 找 抽 一 个 字 节 或者 一 个 字 到 寄存 器 ， 覆 盖 寄 存 器 原来 的 内 容 。 

. 存储 ， 从 寄存 器 拷贝 一 个 字 节 或 者 -个 字 到 主 存 的 某 个 位 置 ， 覆盖 这 个 位 置 上 原来 的 内 容 。 


1 PC 也 背山 地 彼 用 来 作为 个 人 计算 机 的 缩写 ， 斤 而 ， 两 者 之 间 的 区 别 应 该 可 以 很 清楚 地 从 上 下 文中 看 出 来 。 
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. Ék: 接见 两 个 寄存 器 的 内 容 到 ALU，ALU ИТЕН. ННЕНИЯ- WEB, 
ШЖ pom Ж. 
* OH: АРКО 齐备 中 拷 见 一 个 字 节 或 者 一 个 字 到 一 沾 害 存 器 ， 
" Vox. 从 一 个 寄存 器 中 持 由 一 个 字 节 或 者 一 个 字 到 一 个 DO 设备 。 
€ dE УЖЕШ F F, ИЕКТЕН (PC) h, Bo FC 中 原来 
的 值 ， 
第 + 章 音 对 处 理 器 的 工作 原理 暴 寺 更 详 甸 的 说 于 。 
1.42 执行 hello 程序 
ЇЧ А ЖИНИ mm. ИІР ТИЗ ПЕКТИН Н RET UE 
%. БАН ДИ ЕЗ, MAAR ЖАКЕ. EUER ВОРЕН НИНЕ. 
Иж. shell ЖЕТЕ ES. SHUA Ane. ТИРЕ ЕЖА ЯНЕ "hello" Б. 
shell FEFA АСЕ РР ТРЕ, ЕРЕ ИА АШЫР. GE 1.5 所 示 。 








VO аң 
каш. ш 


— 一 一 RU nara dem 
| rmx | аакив 


H5 Hus ri hello s 


"HRIZEBESE Ей ЕЕН. shell ЖЫЛАН T b IC. RE shell 执行 一 系列 措 
令 ， Buih AH hello E Est hihi cp ma WI AES ПЕР, Келі hello xt. ЫЗ 
BEEN CH АЧ ТР "hello, worldin”. 
| 利用 称 为 ОМА СИРИН. AHEM е НЖЖ. Nga EUR SE AERIS ERR 
ЖШ NIA ES. ЗІНІ La or, 

ZH hello 目标 京 件 中 的 代码 和 数据 被 加 载 到 了 存 信 器, ЖИЕ ЖИНИ hello 程序 的 主 程序 中 


ШАЛҒА 7. | 9 


ИЛЕРИ. ЫН "helo, жопа” НВ ЕЛИ ТЕП НИЕТ. БАЯН 
What s Ud. ЖШ ЖЕНЕ. КОРЕ 17 所 示 。 







: * рса 
| | 


r "a. мш 





TE mE тата WWW wH 
ші. LU д "m Y "є 

š. | 3 , 

ик ws нта Ma S 


МЫ siti 
图 1.6 Ju&nüHHRGHTHEBEIS 





кили 





ШЕН 








FM. тына 


ші 


TES- ANEA 
K 





Ei 
| | & ТИПИ EP hello 
"hello, wortdin ша | ШИНЕ 


|I АЕ#ШЕБЕНЕ ИШИ 


15 高 速 缓存 
HLK Т RTMker—i. ЖЕН ЕНЕ Т k 量 的 时 间 把 信息 只 一 个 地 方 挪 


10 * 1+ _ 

到 另 一 中 地方，halls ATASH RETRE ЕН, SAFER CHERIF. 
АДЕ ЕТИНИН. XM КАНЕ ПШ ER. A КІ "hello, жога” КЕЕ ҮЙ Н 
Lb. Е E FH. MISMA Efr FPR ЕНЕ. AK—TARITAERmRESA. X RECS ШЕЕ T 
Wine Lf. ІНЕ, ЕЕНННІН-ТЕЕНБИЯМНАН ЛИЕ ГИЕНА. 

Wd mm. БОЮПИНЖЕНЕ THES RII MM. ТИЙЕТ Eod re T EGRE] 
Жж. nid. —T- APER Ж LAW st ПЕН. L r 100 {8. 但 是 对 处 理 器 而 言 ， МЕШИ 
A НЕН tAE THREE EM E femi mo 1000 ЛТ, 

类 伺 地 ， 一 个 典型 的 军 存 器 文件 只 存储 几 百 字 节 的 信息 ， 与 此 相反 ， 主 存 里 可 存放 几 百 万 字 节 ， 
ЖІ, aEBESE M dp AER X PE ЗИС НЕ А E ТЕЧЕ JL 100 ë. БЕЛІМЕ, ИШАН 
НЕННЕ. IE BaEEES:semgei«ertiHHNM A. ЕЕ Bnet SE EE EE f RE 
LER Ж TU E 

А РАЕН ДЕ IBEX. Resp HH puri Ж. X mew n d 
Е (cache memories, ЇЙ КЕТЕР). ТЕПН ЖЕ ЖЕЕ НЕ БОН. АНША АЛЕ ЖП 
ИНА n. ТЕ Г ТАЕ АИЛЕ I EHTRM. TIERE ELI дей 
fitit ar bL icq m Ev. diga LIS IS Fi TW th. —T Tr UE E Pl 
шй НМ ЕАН НИНЕН REN. 进程 访问 L2 的 时 间 开 销 夏 比 访 问 工 1 的 
HAK 5 阁 ， 但 是 这 仍然 比 访问 主 存 的 时 间 快 5-- 壤 倍 。LI #112 ЕТЕ A ле 
АЛА (SRAM) НІМЕН ЖЗНЕ. 

i qa КЕШЕ» — WRH PE o iW SE ERE ГААН, ИЕНА РЕНЕ K 
ҤЕ ИДЕН. ТЕНЕТ Б Е АНЧА. TT HERI. 


Cpu En 






йара 


图 1.8 ЖЕТИШ 


1.6 ”形成 层次 结构 的 存 情 设备 


{ИЖ pi КЕНЕН Сиш Ег) cB T. FEMMES Cin. 高 速 
m fr ipm muss TERT. ER E, Silu E ЖЕР ИТЕ EH T 
НЯН, WERE LO AETHER. БЕРЕКЕТ, UA ES FS GENER. EX. JF 
psi aga rc Ure. Wi W E PEE IR EHE Ip ГЕТЕ, MEER Ой uU LO. LI ІШЕ 
野 存 处 在 第 一 屋 《【 所 以 称 为 L1)，L3 mathe 3, ТЕШ E. ЯР. 

存 情 器 分 层 结构 的 主要 思 虫 是 一 个 层次 上 的 存储器 作为 下 一 层次 上 的 存储 器 的 高 速 奶 存 。 因 此 ， 


тла Sn П 


寄存 器 文件 就 是 LI1 HERRAT fL) 又 是 L2 的 高 速 缓 存 ，L2 是 主 存 的 高 速 缓存 ， 主 存 是 磁盘 的 
高 速 缀 存 。 在 某 些 带 分 布 式 文件 系统 的 网 络 系统 中 , 本 地 磁盘 就 是 其 他 系统 中 磁盘 上 被 存储 数据 的 商 
ERF. 












更 快 ， | CU WA 
HFT) it Oh ЕРІ 存 铺 器 的 字 
更 贵 的 БИН (SRAM) IE КЕНИНЕН 12 高 速 组 
n / йй sao N олана 
ВО GRAM) Ізет АННА 
De GI 
主 存储 器 
(DRAN) 主 存储 器 保存 取 自 本 地 
ЖА еннен 
CERY) L4 本 地 二 级 存储 
ГІЗІ; CB Н) 


AHT НИЖЕ 


图 1.9 一 个 存储 器 层 次 模型 的 示例 


就 像 程序 员 可 以 运用 LI 和 L? 的 知识 来 提高 程序 性 能 一 样 ， 程 序 员 同样 可 以 利用 对 整个 存 情 器 
层次 模型 的 理解 来 提高 程序 性 能 。 第 6 章 将 更 详细 地 讨论 这 个 问题 。 


17 操作 系统 管理 硬件 


ERMER helo 程序 的 鲍 子 . 当 shell WAEIT hello 程序 时 , 当 hello 程序 输出 自己 的 消息 时 ， 
程序 没有 直接 访问 键盘 、 ETA ЕНЕ ЖЫ. 取而代之 的 是 , 它们 依靠 操作 东 绊 提供 的 服务 。 
我 们 可 以 把 操作 系统 看 成 是 应 用 程序 和 硬件 之 间 插 入 的 一 层 软件 ， 如 图 1.10 所 示 。 所 有 应 用 程序 对 
硬件 的 操作 党 试 者 必须 通过 操作 系统 。 





图 1.10 计算 机 系统 的 分 层 视图 


操作 系统 有 两 个 基本 功能 : 防止 硬件 被 失控 的 应 用 程序 浇 用 ; 在 控制 复杂 而 又 通常 广泛 不 同 的 低 
级 蚀 件 设备 方面 ， 为 应 用 程序 提供 简单 一 至 的 方法 。 操 作 系 统 通 过 图 1.11 中 显示 的 几 个 基本 的 抽象 
Жо GER., Был БА) 实现 这 两 个 功能 。 如 图 1.11 所 示 ， 文 件 是 对 O 设备 的 抽象 表示 ， 
虚拟 存储 器 是 对 主 存 和 磁盘 VO 设备 的 抽象 表示 ， 进 程 则 是 对 处 理 器 、 主 存 和 JO 设备 的 抽象 表 示 。 
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BUM UR ЖБ. 





m 
i | 
| ТТТ 
| | - | 





图 1.11 Ж ЕЖЕНИН ЕЁ SE 


Sit. Unix 和 Posix 

20 4C 60 J-AUE ХЕ. X dee ii Has IBM 的 05/360 和 Honeywell 的 Multics A 
ik. ОБЗ 3 5$ РДАН АН > —, m Mulics MART £4, dp cx РЕ Bit. H 
TXEXYS1 Mute Жи йб, n3 Sd URBES e nd EUER SF 1969 
FEE. 鉴于 对 Muücs ERA HERES, -A ЕТНА. RI Ken Thompson. Dennis 
Ritchie. Doug Mcllroy 和 Joe Ossanna 在 1969 EF t$ DEC PDP-T f Yi EX ИЛЕ kiku — 
T AOL E МЕНҮ. CHER GL ФО Е, Hoe Ee EH AB. +5 P 4 shell Ж 
T. FA k T Mules, tSp E Ps EMS НИЖЕ. 1970 Ж. Brian Kemighan НЫҢ 8 š: 
dio) "Unio. LAURIE, ӘН "Multics" HALSA, ТОТЗ 年 其 内 村 用 CENAS, 1974 年 ， 
Unix Teil Sep +|- 8 Җ[65], . | 

ААҖ К БЕК НКИ Ф НИЧЕА К, Мул Uni ë K+ VSL TASR 
PER. RO Root ri # 20 世纪 10 HIN AURI ЖЕК НАНЫ RR 45 
克利 的 研究 人 员 在 种 为 Unix 4.xBSD ( Berkeley Software Distribution) i£ — & Fick tM Ge T dos 
AEP neme iX, БЕ э. NEZETET НАТА GE k. 也 就 是 System V Unix. 其 他 厂 
商 的 版 本 ， 比 加 Sun Microsystems 的 Ей, BR Lie ВР 和 System V Unix 版 本 中 
FPA más. 

20 4H 80 年 代 中 期 ,Unix Г ҖАЕ IR eb dE M MCI IEEE RH Ж ELLA Бф. 
аленм> лат, ӛтТикітіай, (ü SE h ТІНЕ) ЖЕЛ d deb Unix. 
也 就 是 后 来 Richard Stallman $$ 8) “Posa”, 4& Kit fER ТРЕ, Fe Posix decl, ü RAF 
АйЙЕТЖ d. Ed Uns AOL E Cid. КІНЖІЛ. алина. Mcd 
ФОБИЯ ЫЛА Posix Moll, Unix MGE RD E Ra FERREA. 


171 进程 

E hello 3X FER] BAPEHERLICR E Еш. IFRS RI EIER. HIT ERE E n Tiy E 
нет, EFR LEA HAN S. нон, ШИЕ [aC AC ONE — dE 
RERE PIE . ЕРНЕПН Н RENT ДРЕ В p-e. p E ШІН 
进 竹 的 概念 来 实现 的 ， 进 程 是 计算 机 科学 中 最 重要 和 最 成 功 的 概 知之 一 。 

进 蚂 是 拖 必 系统 对 运行 程序 的 一 种 抽象 。 在 一 个 系统 上 可 以 同时 运行 多 沾 进程 ， 而 每 个 进程 趣 好 
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像 在 独占 地 使 用 硬件 , 我 们 称 之 为 并 发 运行 , 实际 上 是 说 一 个 进程 的 指令 和 另 一 个 进程 的 指令 是 交错 
执行 的 。 探 作 系 统 实现 这 种 亚 错 执行 的 机 制 称 为 上 下 文 切 换 (context switching). 

拘 作 系统 保存 进程 运行 所 需 的 所 有 状态 信息 。 这 种 状态 ， 也 就 是 上 下 文 【eontext)， 包 括 许 多 信 
B. H PC 和 寄存 器 文件 的 当前 值 ， 以 及 主 存 的 内 容 。 在 任何 一 个 时 刻 ， 系 统 上 痢 上 只 有 一 个 进程 正 
在 运行 。 当 泉 作 系统 决定 从 当前 进程 转移 控制 权 到 某 个 新 进程 时 ， 它 就 会 进行 上 和 下文 切换 ， 即 保存 当 
前 进程 的 上 下 文 、 恢复 新 进程 的 上 下 文 ， 然 后 将 控制 权 转 移 到 新 进程 。 新 进程 就 会 从 它 上 次 停止 的 地 
方 开始 。 Bd 1.12 展示 了 我 们 的 示例 bello 运行 的 基本 场景 。 

在 我 们 的 示例 场景 中 有 两 个 同时 运行 的 进程 ，shett 进程 和 bello 进程 。 最 开始 ， 只 有 shell 进程 在 
运行 ， 等 待命 令 行 上 的 输入 。 当 我 们 让 它 运行 hello 程序 时 ，shell 通过 调用 一 个 专门 的 函数 ， 即 系统 
调用 ， 来 执行 我 们 的 请 求 ， 系 统 调 用 会 将 控制 权 传 递 给 操作 系统 。 操 作 系 统 保存 shell 进程 的 上 下 文 ， 
创建 一 个 新 的 hello 进程 及 其 上 下 文 ， 然 后 将 控制 权 传 给 新 的 hello 进程 。 在 hello 进程 终止 后 ， 操 作 
系统 恢复 shell 进程 的 上 下 文 ， 并 将 控制 权 传 回 给 它 ， 它 会 继续 等 待 下 一 命令 行 输入 。 







时 间 进程 1 HE 
FRO тт 2 

应 用 程序 代码 

操作 系统 代码 | 上下文 切换 
应 用 程序 代码 
操作 系统 代码 Еки 


—r 


应 用 程序 代码 









图 1.12 进程 的 上 下 文 切换 


实现 进程 这 个 抽象 概念 需要 低级 癸 件 和 操作 系统 软件 的 紧密 合作 .我 们 将 在 第 8 章 中 揭示 这 是 如 
何 工作 的 ， 以 及 应 用 程序 是 如 何 创建 和 拧 制 它们 的 进程 的 。 

进程 这 个 抽象 概念 还 暗示 着 由 于 不 同 的 进程 交错 执行 , 打 乱 了 时 间 的 概念 , 使 得 程序 员 很 难 获得 
运行 时 间 的 准确 和 可 重复 测量 , 第 9 章 讨论 了 现代 系统 中 的 名 种 时 间 概 念 , 并 描述 了 用 来 获得 准确 测 
量 值 的 技术 。 


172 #8 

尽管 通常 我 们 认为 一 个 进程 只 有 单一 的 控制 流 , 但 是 在 现代 系统 中 ,一 个 进程 实际 上 可 以 由 多 个 
称 为 线程 的 执行 单元 组 成 ,每 个 线程 都 运行 在 进程 的 上 下 文中 , 并 共享 间 样 的 代码 和 全 局 数据 .由 于 
网 络 服务 器 中 对 并 行 处 理 的 要 求 , 线程 成 为 越 来 越 重 要 网 编程 模型 , 因为 多 线程 之 间 比 多 进程 之 问 更 


容易 上 共享 数 据 ， 也 因为 线程 一 般 都 比 进程 更 高 效 。 在 第 13 章 中 ， 你 将 学 习 到 并 行 的 基本 概念 ， 也 包 
括 线 程 化 的 概念 。 


173 ШТЕЙ 
RESET THREE ЕЛ ERRET IRS. 好 像 每 个 进程 都 在 独占 地 使 用 主 存 。 


每 个 进程 看 到 的 存储 器 都 是 一 致 的 ， 称 之 为 虚拟 地 址 空间 。 图 1.13 所 示 的 是 Linux 进程 的 虚拟 地 址 
空间 《其 他 Unix 系统 的 设计 也 与 此 类 似 }。 在 Linux 中 ， 最 上 畜 的 四 分 之 一 的 地 址 空间 是 预 留 给 操作 
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көтін, 这 对 所 有 进程 都 一 样 , КШК = Н ЗЕ а FOL RH a Po X ff 
代码 和 上 数据。 请 注意 ， 图 中 的 培 址 是 从 下 往 上 增 坟 的 。 


让 ] EE FETEFE == 





= 了 用户 代 码 不 可 兄 


бкестелеге Ше ium 


printf BrX 


Uq 0902000 


M. hella e [BT 
кшй ir 


йн iig Eam 


8981.13 НЕШЕУ 
tT utr RUE ded hi sE (а d 1А ЕЙ ЖЖ Сага) БІН, TEETE NDE. (ЕЖ 
Wifi fedes Ent xxx vi. RE W RS TIE. АЙН, EF 0 
КЕНЖЕ SE. 

. AARAA. Tank RI ЕНЕ, ЕЕЖПЕНС HSE shy pi GRIS. 
{шн е Жн ПА TREFA ER. HEREDES КИР ak ik ALT ЖҰ hello. 在 
ТЕНЧ, WARIATA X Hh [рК RUE. 

е Ж. fondos E ME Ge dT AC. КЕНЕ ЖЕШЕТ — В {ЕТЕ ЖШ 
了 去 小 的 ， 与 此 不 同 ， 必 为 调用 怕 гас 和 | free 3X FER) C ER PAR S. ЖТІЙНЕ 
tmp his EMRE. ЖЖ ТОРЕ ДИОР IRT, PETIERE ОАЕ УСНЕ. 

. EA. {ЕНЕН n frg (80 {ЫН C HH] ЖИЙ C 标准 库 和 数学 库 这 样 共 享 库 的 代码 和 数 
其 的 区 域 。 共享 库 的 慨 志 非常 强 太 ,但 是 也 是 个 相当 玲 异 的 概 客 。 在 第 7 章 我 们 掌 习 动态 链 
接 时 ， 将 学 习 共 享 库 是 如 何 工作 的 。 

. 赋 ， 位 于 用 户 虚 拆 地 址 空间 顶 训 的 是 用 户 栈 ， 编 译 跨 用 它 来 实现 函数 调用 。 和 堆 一 样 ， 用 户 
AN ñ: y ned rr m] ПГ ЖЕР ЕЛІНЕ, РІМ, 每 次 我 们 调用 一 个 函数 时 , НКИК. 
每 次 我 们 从 函 是 返回 时 ， 夫 就 会 收 疝 。 在 第 3 章 申 你 将 学 习 妨 详 里 是 如 何 恒 用 杭 的 。 

. 内 玉 身 拟 生 情 吕 ,内 过 是 损 作 系统 总 是 驻 贸 在 存储器 中 的 部 分 。 地 址 空间 顶部 的 国 分 之 一 部 人 
ЖАНЕ Н. ШИГЕ dv Girar T: ПН НЕН НЧЕ НЕЕ FCRI ЖІК. 

虚拟 存 情 器 的 运作 需 相 硬件 和 捧 作 系统 轨 件 问 的 精密 复 打 的 互相 合作 , ЕЕ ЕНІНЕН 

地 址 的 硬件 翻译 .基本 思想 是 把 一 个 进程 卓 扫 存 储 器 的 内 容 存 企 在 厂 盘 上 ， 炉 后 用 主 存 作 为 碰 得 的 南 
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AUTE. 310 ЕЕЕ LIE, ША ЛП ААД RAD GE. 


1.74 文件 

KH APA EE xS. HA UO ЕЙ, ӘЛЕ. ЯН. Ба БАСЫН, ОО 
看 成 是 文件 , SR BR S P ti Sa A tm i BE ДОШ Т ЧЕК Unix UO 的 -МЕЯ ЖОЕ ПИН ЕЕ ЕЖ 

X FA AP B] ПЕ ЖИИ БАҒА СЕ ТАГЫ DB EFE] FR ГЕ BERE А-А ДЕЙЛ ИНЕ ТҮН 
ПРО A ЕЙ МО dd. ФП, АМЕН y (HP ЕТУ ҒАНА ПДТ SEA АУ T E ДИЕ 
EARRA. EH. E- ARET Г) ИЕН SS] ES EI ILS I Em fT. PRORA 11 章 中 学 
2 Unix VO, 

S. Linux 项 目 

1991 3-8 月， 一 个 高 为 Linus Torvalds $5 21-5 ВЯ, 5 HOS ACT -- ЛТ Ж Unix 的 操作 系统 
内 核 ， 

Ж. Ё: torvaldsGkIaava.Helsinki.FE (Linus Benedict Torvalds} 

AT 5028; comp.os.minix 

ХЖ: dE minix РЕВ 843422 

岳 要 ， 关 于 我 的 新 操作 系统 的 小 调查 

Mg: 1991 年 8 月 25 日 20:57:08 GMT 

每 个 使 用 minix (LE, 4641139 — 

我 正在 微 一 个 免费 的 ) 用 在 386 (486) AT 上 的 揉 作 系统 【只 是 业余 爱好 ， 它 不 会 你 GNU M 
样 庞大 和 和 专业) 这 个 想法 自从 4 АЯК ЖЕЙ, ЭЖЭ] ілі mimix 喜欢 和 不 满 的 反 情 意见 ， 
玉 为 我 的 揉 作 系统 在 菜 此 方面 是 模仿 它 的 [ 其 中 包 插 相同 的 文件 系统 的 物理 设计 ( 因为 蒜 些 实际 的 原 
因 3]. 

我 现在 已 经 移植 了 bash (108) de gcc (140), 并 县 看 上 去 能 运行 ， 这 意味 着 我 党 要 几 个 月 的 时 
ЖЕРЕ У, 并且 ， 我 想 要 知道 大 多 元 人 想 要 的 特性 ,欢迎 性 何 建 议 ， 但 是 我 无 法 避 证 
我 能 实现 他 们 ，: - ) 

Linus (torvalds &kruuna.helsinki.fi) 

EFR, ЭРИТ, MUROS T AX. Lux 逐渐 发 展 成 为 一 个 技术 和 文化 现象 ， 道 过 和 GNU 
项 目的 力量 结合 ，Linux 项 目 发 形成 为 了 一 个 完整 的 、 特 合 Posix 标准 的 Unix 操 必 系统 的 版 本 ， 包 括 
内 核 和 所 有 支撑 的 基础 设施 ， 从 手持 设备 到 大 一 计算 机 ，Linux 在 范围 如 此 广泛 的 计算 机 上 福 到 了 应 
用 。IBM 的 一 个 工作 组 甚至 把 Liaux 移植 到 了 一 块 手表 中 | 


1.8 利用 网 络 系统 和 其 他 系统 通信 


系统 漫游 行 之 至 此 ， 我 们 一 直 是 把 系统 视 为 - -个 孤立 的 硬件 和 软件 的 集合 体 。 实 际 上 ， 现代 系统 
至 贡 后 通 过 网 络 和 其 他 系统 连接 到 - -起 的 。 从 -个 单独 的 系统 来 看 ， 网 络 可 被 视 为 又 -个 TO 设备 ， 
如 图 1.14 所 下 。 当 系统 从 主 存 拷贝 一 串 字 符 到 网 络 适 配器 时 ， 数 据 流 经 过 网 络 到 达 另 一 台 术 器， 而 
不 二 到 达 本 邮 磁 盘 驱 动 占 ,相似 地 ， 系 统 可 以 读 避 从 其 他 机 器 发 送 来 的 数据 ， 并 把 数据 拷贝 到 自己 的 
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sma | Жыла asun) неден 


НЕ wi | нән + | 
wa ти) 
图 1.14 网 堵 也 是 一 种 UO 设备 

МНЕ Internet 这 样 的 使 球 网 络 的 出 现 ， 从 一 冲 主 机 持 由 信息 到 另外 一 澡 主机 已 经 成 为 计 算 机 系 
WX ETHio-—. ЕШ, WETE Bep dE. HS. БІРНШІ telnet ЕНЕҢ 
Tu: deg D (e pii . 

问 到 我 们 的 hello 示例 ， 我 们 可 以 使 用 热 亚 的 telnet 应 用 在 一 个 远程 主机 上 运行 bello ЁЛ. Big 
ENTERAL tinea 6 Р AERAR EIEN telnet 服 务 器 .在 我 们 登录 到 远程 主机 并 运行 shell 
后 ， 远 端的 shell ҮЕЖЕ N tet. 只 这 点 上 来 看 ， 在 远 鲍 运行 hello 程序 包括 如 图 1.15 所 
УЬ TK x m. 

1 RETRE 


l^. “hello” 2 Ж кін Io EXE 
= — атласы 0 - › авн ма Ri 
| awa Š ин шы | Tn е. 
NL | ./ш ы BHCHR 
EMT „узлы | E A үлке ELET 
ЕТТ ts ABRE i 


НІ "hello worldin” 


8H 1.15. HA telnet ИМАННАН hello 
"HER TIE telnes ЖЕН A" hello" š F [als t к. ЖАКЕ hik СЕРЕ ЖООН) telnet 
的 服务 器 。 在 telnet НҰРЖАН ПЕ ЫДА ЕК. Amd LA shell ГЕ, ЖҚЖ. ж 
shell 运行 hello БҮЛ. ЕН НИТ НЕ telnet |Н. ШЕ, ene ЕЗЕЙГІМЕНЕНН Hp 
telnet Ж "Ж. de P ERE UG UR RR IE TP CHR Е. 
APP "НИЕ ЖЕУ [er H pm ie BCT MEER ЫН А БАЕ Ж h Н. ZO 12 йр, Ж 
ШИНЕ. ЖЕНІНДЕ Ж RAY Web 服务 器 ， 
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19 下 一 步 


我 们 旋风 式 的 系统 漫游 到 此 就 结束 了 。 从 这 次 讨论 中 要 得 出 一 个 很 重要 的 观 操 ， 那 就 是 系统 不 仅 
仅 只 是 硬件。 系统 是 互相 交织 的 硬件 和 系统 软件 的 集合 体 , 它们 必须 共同 协作 以 达到 运行 应 用 程序 的 
最 终日 的 。 本 书 的 余下 部 分 将 对 这 个 论点 进行 展开 。 


110 小结 


计算 机 系统 是 由 硬件 和 系统 软件 组 成 的 , 它们 共同 协作 以 运行 应 用 程序 。 计算 机 内 部 的 信息 被 表 
ЖА -组 组 的 位 ， 它 们 依据 水 同 的 上 下 文 又 有 不 同 的 解释 方式 。 程 序 被 其 他 程序 翻译 成 不 同 的 形式 ， 
开始 时 是 ASCI 文本 ， 然 后 被 编 详 器 和 链接 器 翻译 成 二 进 制 可 执行 文件 。 

处 理 器 读 取 并 解释 存放 在 主 存 于 的 二 进 制 指令 ， 因 为 计算 机 花费 了 大 量 的 时 间 在 存储 器 、LIO x 
备 和 CPU 寄存 器 之 问 找 贝 数 据 ， 所 以 系统 中 的 存储 设备 就 被 按 层次 排列 ，CPU 寄存 器 在 顶部， 接着 
是 多 层 的 硬件 高 速 缓存 存储 器 、DRAM 主 存储 器 和 磁盘 存储 器 。 在 层次 模型 中 心 于 更 高 层 的 仓储 设 
备 比 低层 的 存储 设备 要 快 ， 单 位 比特 造价 也 更 名 ， 程 序 员 通 过 理解 和 运用 这 种 存储 层次 结构 的 知识 ， 
可 以 优化 他 们 有 程序 的 性 能 。 

操作 系统 内 核 是 应 用 程序 和 硬件 之 问 的 媒介 , 它 提供 三 个 基本 的 抽象 概念 : 文件 是 对 ГО 设备 的 
抽象 概念 ， 虚 拟 存 储 器 是 对 主 存 和 磁盘 的 抽象 概念 ， 进 程 是 处 理 器 、 主 存 和 ГО 设备 的 抽象 概念 ， 

最 后 , 网 络 提供 了 计算 机 系统 之 间 道 信 的 手段 , 从 某 个 系统 的 角度 来 看 , 网 络 就 是 一 种 ГО 设备 。 


参考 文献 说 阴 
Ritchie 写 了 关于 早期 C 和 Unix 的 有 趣 的 第 ~- 手 资料 3，64]。Ritchie 和 Thompson ERT RE 
出 版 的 Unix 资料 [65]。Silberschatz 和 Gavin 0R # T £: F Unix 不 同 版 本 的 详尽 历史 。GNU 
Cwww.gnu.org) 和 Linux Cwwslinux.org) 网 页 有 大 量 的 当前 和 历史 信息 。 不 幸 的 是 ， 无 法 在 线 获 得 
Posix 标准 ， 必 须 通过 IEEE Cetandards.ieee.org? 定购 。 


”第 1 部 分 
程序 结构 和 执行 


|N 们 台 计 算 机 系统 的 深 索 是 从 学 习 计 算 机 本 身 开 始 的 , 它 由 处 理 器 和 存储 轿子 
我 杂 昨 组成 。 在 模 心 名 分 ， 我 们 需要 方法 来 表示 基本 数据 类 型 ， 比 如 玫 禾 和 实 
| ИНА. MUS. ЕПЗ ФЕНОЛ ЕТЕНЕ, ШЕШ 
k= AM A С ВЕЧНЕ, METRE, RAAE, ЖҰ 
ЇН ГИРОНА ЕЕЕ НЕЕ. -ERER TARANA, ПИ 
КЕ = О SWEET, EANA ЖП 
了 以 统 的 设计 来 结束 本 部 分 ， 这 是 现代 计算 机 系 辜 最 复杂 的 部 分 之 一 。 

下 书 的 这 一 者 分 更 福 着 元 深入 了 解 应 用 程序 是 如 何 被 表示 和 执行 的 。 你 将 学 合 大 
Шак, Wm bus РОЗНАЕ PERPE, 
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现代 计算 机 存储 和 处 旦 以 一 俏 信 号 表 沙 的 信息 。 这 些 普通 的 二 进 制 数字 ， 或 者 位 《bity， 形 成 
了 数字 革命 的 基础 ， 大 家 熟悉 的 使 用 了 1000 多 年 的 十 进 制 (以 十 为 基数 ，base-10) А98 РЕ, 
在 12 性 纪 被 阿拉 伯 数 学 家 所 改进 ， 并 在 13 性 纪 被 奉 人 利 数学 家 Leonardo Pisano〔 更 有 名 的 叫 法 是 
Fibonacci) 带 到 西方 ， 使 用 十 进 制 表 示 法 对 于 有 上 个 指头 的 人 类 来 说 是 很 日 然 的 事情 ， 但 是 当 构 造 
存储 和 处 理 信 息 的 机 路 时 ， 二 进 制 值 工作 得 更 好 ,二 值 信号 能 够 很 容易 地 表 沙 、 存储 和 传输 ， 例 如 ， 
可 以 表示 为 穿孔 卡片 上 有 洞 或 巨 洞 、 导 线 上 的 高 电压 或 低 电压 ， 或 者 们 场 引起 的 顺 时 和 针 吉 这 时 针 ，。 
基于 一 值 信号 的 存储 和 执行 计算 的 电子 电路 非常 简单 和 可 靠 ， 使 得 制造 商 能 够 在 一 个 单独 的 佳 片上 
集成 日 万 个 这 样 的 电路 。 

昔 独 地 来 说 ， 单 个 的 位 不 是 非 党 有用， 然而 ， 当 我 们 把 位 组 合 人 在 一 起 ， 册 加 上 品种 解释 
(interpretation)， 即 给 予 不 同 的 各 能 位 模式 以 会 意 ， 我 们 就 能 够 表示 任何 有 限 集合 的 元 素 。 比 如， 使 
用 一 个 一 进 制 数字 条 统 ， 我 们 能 够 用 位 组 来 编码 上 站 负数 。 通 过 使 用 标准 的 字符 码 ， 我 们 能 够 对 У 
交 档 中 的 字 竺 和 符号 进行 编码 。 在 本 章 中 ， 我 们 将 讨论 这 两 种 编码 ， 以 及 表示 负数 的 网 介 利 近似 实 
ЖІК. 

我 们 考虑 -种 最 重要 的 数字 编外 。 无 谷 号 〈unsigned) md TAE Н ER. Ж 
示 大 十 或 者 等 丁 零 的 数字 ,二进制 补 码 (two's-complement ) 编码 是 表示 有 符号 整数 的 最 常见 的 方式 ， 
有 符号 整数 胞 是 为 正 或 者 为 负 的 数字 。 汉 点数 【floating-point) 编码 是 表示 实数 的 科学 记 数 法 的 昼 
二 为 基数 的 万 本 。 计算 机 用 这 此 不 同 的 表 汪 方法 实现 算术 运算 ， 例 如 加 法 和 生 法 ， 类 似 十 相应 的 束 
数 和 实数 运算 ， 

计算 机 的 表示 法 用 有 限 的 位 数 来 对 一 个 数字 编 妈 ， 寺 此 ， 当 结果 杰 大 以 至 不 能 表示 时 ， 尼 些 运 
算 束 会 浇 出 (overflow)}。 这 会 导致 某 些 邻 人 吃惊 的 后 果 。 例 如 ， 在 太 多 数 今 天 的 计算 机 上 ， 计 算 表 
达 式 200*300*400*500 2:18 11-884 901 888. 这 违背 了 得 数 运算 的 蛙 性 一 一 计算 一 组 下 数 的 乘积 产生 
了 一 个 为 负 的 结果 。 

н 方面 ， 整 数 的 计算 机 运算 满足 了 真正 整数 运算 的 许多 普通 的 属性 。 WU. ЖЕЛІН 
ATRE AR- -来 计算 下面 任何 OC 老 达 式 ， 部 会 得 出 884901 888; 

(500*403)] *!300*#200D) 

(Бра ЭЗОП ОП 

| (20D * 500) *300) *400 

400*:2035*(300*5001) 

ИГИЛИК B РЛЫ TIE SR, ШЕЗТЕЛ ЖМ! 

浮 癌 运算 有 完全 不 同 的 数学 属性 , 虽然 溢出 会 产生 特殊 的 值 +e, HE E ЕЖЕ RE АЙМЕН. 
妨 一 省 面 ， 由 于 表示 的 精度 有 限 ， 削 点 运算 是 不 可 结合 的 。 例 如 ， 在 大 多 数 机 器 上 上 ，C 表达 式 
(3.14+1e20) -1е20 KARZE 0.0, m 314+ (le20-le20) KEKEE 3.14， 

ЖӨ ЗЕБИ ЛК AIR. RIRE ГЕНШИ ЖЕНЕ КЕНІН Riz PL ISTE. ELT io 
ЫШТЕ ИЕНЕН ІРІ BEBE IE LE. TH АС AE. ВЕЕ Su MI UE GEH ЕН TERRIER 
序 来 资 ， 这 种 了 解 是 非常 重要 的 。 

计算 机 用 几 种 不 同 的 __ 进 制 表 水 来 编 妈 数值 ， 在 第 3 ЕН МАРАЛ АР, КЕН 
东芝 印 表 示 方 式 。 在 本 章 中 ， 我 们 描述 这 些 编 码 ， 并 给 你 一 些 关 于 数字 表示 的 推理 练习 。 

利 过 直接 操作 位 级 的 数字 表 泵 ， 我 们 得 到 了 所 种 进行 算术 运算 的 方式 。 理 解 这 些 技术 对 于 理解 
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ирин 下 立 上 ， 使 用 完全 相同 的 数字 элей. ЕЖЕТ С 的 所 有 内 容 对 
C++ 部 有 效 ， 另 一 方面 ，Jawa 语言 创造 了 一 亦 新 的 数字 表示 和 记 算 标准 ，C EE HEU 3 R И ЕЕ 
ERAR. H Java 标准 在 数据 的 寿 式 和 篇 码 上 是 详细 而 精确 的 ,在 素 章 中 好 几 丫 地 三 我 们 都 这 出 了 
Java 支 标的 表示 和 运算 。 
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大 多 数 计算 机 使 用 四 位 的 块 ， 或 叫做 字 节 【byley， 来 作为 最 小 的 可 导 址 的 存 情 器 单位 ， 而 不 是 
访问 邦 栅 天 中 单独 的 位 。 机 器 绥 程 序 将 存储器 杭 为 一 个 非常 大 的 字 节 数组 , о АА Е Супца! 
тетогу). 好 鱼 帆 的 短 个 字 节 都 由 一 个 必 一 的 数字 来 标识 ， 称 为 它 的 地 址 【address)， 所 有 可 能 地 址 
FIR fr SCHON k ashata ің Cvirtual address space)。 正 如 它 的 名 字 表 明 的 ， 这 个 虚拟 地 址 空间 只 是 
ТҮННЕН ЕНЕ MIS (image), 实际 的 实现 ! 见 第 10 Ж) 使 用 的 是 随机 访问 存 全 器 
RAM. ІНІН. ИЕН IER EIC IE DTE 8, IOUBUTAROLT IHR E h HR. 

WRH IS (T IRL GEI — MERERI TE ШР f RI ТЕ, ЖЕШИН 
5551. (program obje), НЕЕ, БЕНЕН. MARRAN. SH abya CLUB CARERE 
ШЕКЕЛ ЕНЕ. RESTE EBRD ЕН нж, мш, С ЧЕНИ CE 
КЕНИ КН. -TEURER HERRAT) АЕН СЕРЕН. 
С НЕ RRRA ARRE, BEAT CRR, EUR ELIO ER 
THERE Ur ИЛЕМ EE TE ER HEURE AE DAL ЕЕСЫНЕЕРЕ ЖЫН, UC EE HIC: 
ПЕШЕНЕНЕ. CHAREE ЖЕНЕН НА, TARTES 
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211 十 六 进 制 表示 法 

一 个 侍 节 包 所 8 位 。 在 二 进 制 表 未 法 中 ， 它 的 值 域 是 00000000,-- 11101111, WEA RtH 
整数 ， 它 的 值 域 就 是 0w~25516。。 商 种 符号 表示 法 对 十 描述 位 模式 束 说 痢 不 是 非常 方便 。 一 进 制 下 
ЖАЛ. 向 使 用 十 进 制 表示 法 ， 与 位 模式 的 互相 转化 很 麻烦 , 替代 的 方法 是 , 我 们 以 16 为 基数 ， 
或 者 叫 估 十 冯 进 制 (hexadecimal》 数 ， 来 书写 位 模式 。 十 六 进 制 (简写 为 “Hex”) 使 用 数字 “0”~ 
“9 7”， 以 及 字符 “A ”一 “上 F” 来 表 小 16 个 可 能 的 值 。 图 2.1 展示 了 16 个 十 六 进 制 数字 对 应 的 十 进 
制 值 和 一 进 制 值 。 出 盾 六 进 制 书 写 ， 一 个 字 节 的 取 值 范围 为 00,7TFF.. 

EC rh, DL Ox 或 0X 开头 的 数字 常量 被 认为 是 十 六 进 制 的 值 。 字 符 “A ”一 “F” 既 可 以 是 大 
写 ， 也 可 以 是 小 号 ， 例 如 ， 我 们 可 以 将 数字 FA1D37B,, 写 作 OxFAID37B.. RÆ Oxfald37b, BR: E. 
大 小 写 混合 ， 比 如 ，0xFalD37b。 在 本 书 中 ， 我 们 将 使 用 表示 法 来 表示 十 六 进 制 值 ， 


十 六 进 制 数字 


АЛЕ 
82! 十 六 进 制 表示 法 


天 个 二 六 进 制 数学 都 对 16 MPRI -个 进行 了 编码 。 


编写 机 器 级 程序 的 一 个 常见 任务 就 是 手 士 昌 在 位 模式 前 十 进 制 、 二 进 制 和 十 六 进 制 表示 必 间 转 
换 ， 二 进 制 和 十 六 进 制 之 词 的 转换 是 简单 丰 接 的 ， 因 为 可 以 一 次 执行 - -个 十 六 进 制 数字 的 转换 。 数 
TONER RIA S 21 所 示 的 表 。 在 你 脑 中 做 转换 的 一 个 简单 的 穿 门 是 ， 记 住 上 六 进 制 数字 A. C 
和 了 相应 的 十 进 制 值 。 而 对 于 把 十 六 进 制 重 B、D 和 王 翻译 成 十 进 制 值 ， 则 叮 以 通过 计算 它们 与 前 
三 个 值 的 相对 关系 来 完成 。 

比如 ， 假设 给 你 一 个 数字 0x173A4C。 可 以 通过 展开 每 个 十 六 进 制 数字 ， 将 它 转 痪 为 一 进 制 格 
3, RH FUE: 


Ч) 1 7 3 А, 4 С 
二 进 制 0001 0:11 0011 1010 0100 12100 





这 村 就 给 出 了 二 进 制 表示 000101110011101001001100. 

REIK. WEE A EBRE L111001010110110110011， 夭 吉 以 通过 首先 把 它 分 草 为 每 四 
世 一 组 ， 来 把 它 转 换 为 十 六 进 制 。 不 过 要 注意 ， 如 果 位 冲 数 不 是 四 的 倍数 ， 最 左边 的 一 组 可 以 少 于 
四 位 ， 坪 面 用 零 补 是 。 然 后 将 每 个 四 位 组 转换 为 相应 的 十 六 进 制 数字 : 

一 进 制 11 1:00 1010 1101 1011 0011 

-六 进 制 3 C д D B 3 


| пана тки 25 
SAT dece RA: 
A. 特 ÜxSFTAG93 ҒА. 
B. Ясы 101101111001 1100 Hi h Hr Jc tj. 
C. 3E UxCAESD а н. 
D. ##— š 101011011011111100110 ERR 3 Ti tl 


ЭИ x R 3 ЖЕ, БИН, ЯҒЫ”, хет, TArTer Ld s S ed x SATARE, p 
Faft x HORNATTE] mil н tE. +АЖ ИШ О ЕЕ CURSO, КЩ. HERE 
M He А ЖЕ, Щ{10<1<3, 我 们 可 以 把 x THEE HARNEY 1 SD. 2 (=1). 
4 (m2) EON 8 G-3), ЕНЕМ) FOP SHE) 0, ЕШ, x2204822". RA л=11=3+4.2. 
ATARA EE Ox 800. 





PRERA TA ок [8] f) q R (FEL RH E Bio — MN. 961 I REOR: 
x 特 换 为 十 六 进 制 ， 我 们 可 以 反复 地 用 16 t х. WP — 8 oH EB r, ICE х=4-16+. 
ME ВИПАС Z deut rfe E NUR. ЖИЕ ЕЛЕНЕ ЗІНІ ЕН 
EF. Pim, Ж-М 314156 的 转换 ， 
314156 


= 19634-16412 (С) 

19634 = 1227-1642 (2) 
1277 = 76: 16+11 (B) 
16 = 4.16«12 (C) 


4 = 0.1644 (4) 
从 这 里 ， 我 们 能 恋 出 十 六 进 制 表 示 为 0x4CB32C， 
RER. 特 - TAREHE THRA TEHE. 我 们 可 以 用 相让 的 16 IM S ELSE dis fl 
Wr. ЕШ. Ar NU TAF ИПИНЕ HEC 7.16. 10-164 15=7.256+10- 16 
+ 1521792 + 160 + 15 = 1967, 
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ЖУ 23 


АТИНА ТОЙ ТЛИ, ШЕТА ФАА MUR, ЕАН. 
二 进 制 和 十 六 进 制 性 : 


www |  — 
ceni 


LOS HI 


13106011] 





X. 十 进 制 和 十 六 进 制 闻 的 转换 
этана тањ инан сика, аиынын БАЕ т. 
и, таё Per iE Be MNR HUE HR ан; 





V! /usr/local/bin/perl 
# Convert list of decimal numbers into hex 


1 
2 
3 
4 for ($i = б; бі < GARGV: $i++) Í 
5 printf(*$dite üx&xn*, $ARGV[Si], SARGV[Si]); 
& j | 





ЕНН УТАА, ж. 
unix» ./d2h 100 500 751 
елей. 

100=0х64 


500=0к1 #4 
75laU0x2ef 


тоз, TAA HARI 
1 和 aa LE. 


4 % Convert list of hex numbers into decimal. 
3 


HA 4 тфа 27 


4 for ($i = бу $i < BARGV) $ie«] е iEn ты: 
5  $val = hex($ARGV[Bi]); — ER 
8 
1 





printfi"0OxWx < d\in", $val, $val]; фй 





53H24 Еж 


TOECT Hob Ee AGE ЖМ, ERSTER EXEET IURE, 提示 : 
ПЕРАТА o dee GERE REL Ф, 9L 635 EB. 

А. 0х5й2с+0хВ= 

В. üx502c-030« 

C. 0х50%с+б4= 

D. Ox 50da-(x 502c 


212 Ж 

每 台 计 算 机 都 有 一 个 字 长 (word size, MURRAN RENA (nominal size. 国 
轨 应 执 地 址 是 以 这 术 的 字 来 编码 的 ， 所 以 字 长 帷 定 的 最 重要 的 系统 参数 就 是 庶 拟 地 卉 空间 的 最 大 
太 小 ， 也 就 是 说 ， 对 于 一 个 字 发 为 a 位 的 机 器 而 言 ， 虚 拟 地 赴 的 藻 围 为 0—>7-1, BER £u El 
rgy, 

ЖАКИШ SHERHE N KANYUT HERUM GE SI] 4 TEZY CE AGED, 也 
WI. MRR 4x ET. BENKER. СТ, ВЕҢАРЕЗИЖ 
大 型 的 科学 和 数据 库 应 用 需要 更 大 的 存储 了 ,因此 , БШГЕШ ЕНЕНЕ. "EC 64 位 的 高 名 机 
ЕИН Е Ж. 


213 数据 大 小 

ИНЕ ВЕЕ ТЕ Я [АТА г А ЕСЕ, ЕИЖНЕНИВЕННА, MIRRE 
FRR. Ей, РСЕ RET ЕВА E URG. ЫЕ УШ ЕН. Т ny 
ЕЕЗ Е тетра РЕТ AR. 

САРОСАР RI Р RRA. CARR char EA ДЕ“ ear" 
НРА GM С Ж ру Wege mx. {Н E UE ЕВЕ СЙ. 
СІБЕ im 之 前 还 能 加 上 限定 词 long 和 shon, SERM МИК. W 22 ERTAS 
FW C 数据 类 型 分 配 的 宇 节 数 , 准确 的 字 节 数 恢 琅 于 机 可 和 编译 器 ,我 们 展示 了 黄村 有 届 上 性 的 例子 ， 
各 至 的 32 位 机 可 和 Compag Alpha 体系 结构 ， 其 中 Compaq Alpha 是 针对 高 端 应 用 的 64 人 机器。 二 
ӘН 位 机 器 使 用 “和 典型 ”的 分 配方 式 。 可 以 观察 到 ;“ 短 = eo AS, ІП ЛӘП) int 
为 四 衬 节 ,“ 长 ”整数 使 用 机 本 的 全 字 发 ， 

图 12 也 说 明了 指针 【例如 ， 一 个 丢 声 明 为 具 型 为 “char** HER) ОШУ. л 
监 机 器 还 支持 两 种 不 同 的 浮 点 格式 : 单 精度 [在 已 中 南明 为 foai) 和 豫 精 度 ! 在 局 中 声明 为 double). 
ЖЕНЕТ ЗҮ, 


char 
&hort int 


inr 


long int 


E а= Та 





Hz: СЕНЕ ТИНА СЕТ р) 
ЕН ИЕЫ Ж]. 
%СЕШ##й. МАНЕ 
РАВНЕ ET, bw 


T "pi 
ИрИ Е, h ES 了 的 一 个 寺 章 ， 抽 如 
char *р; 


就 将 一 个 措 竺 声明 为 指向 char 训 型 的 一 个 对 章 ， 


程序 站 簿 该 力 图 使 他 们 的 释 序 在 不 同 的 机 器 和 蝙 译 占 上 可 称 植 ， 可 称 植 性 的 一 个 坟 面 就 是 刷 程 
FA PEE З K PARURE. C 标准 对 不 同 数据 类 型 的 数字 范围 设置 了 下 界 ， 这 点 在 后 面 
还 将 许 到 ， 但 是 却 没有 上 界 。 因 为 22 位 机 器 在 过 去 加 年 里 一 直 是 标准 ， 许 放 程 序 的 编写 都 是 以 图 
22 中 “和 典型 的 邓 们 机 中 ”到 出 的 分 配 诛 则 为 假设 的 ， 在 不 名 的 将 来 ， 随 着 64 位 机 跨越 来 算 重 要 ， 
ТЕ ЕРИ РЕНЕ НОЗЕ ЕЧ, РЕ ВОТ ТЕС Е НЕ, НН, а, Рр 
MARRAINE imc 35 8 e re p E ME Е TEE КН. DX E 32 位 的 机 器 上 工作 
ЕЖ, HEEE Alpha 机 器 上 却 会 导致 问题 


214 寻 址 和 字 节 顺序 

对 于 哩 艳 多 字 节 的 程序 对 象 ， 我 们 必 磋 建立 两 个 规则 ， 这 个 对 象 的 地 址 是 什么 和 我 们 在 存 昔 器 中 
МИЕНА РЕЧЕ ИНЕТ. ЛЕНЕ L. ТАЙ EM CERE OPER, BOTHE 
ЖЇН ЈН Е, Blim, iQ — 3654 3 int КЕЕ НАНЕ OX 00. ЕШ, HARE 
TA sU 的 时 为 Ox 100. NE. x LPS MORE TE RE TE TEGERE I) Ox 100. Ox 1L. Ox 1021 0103 位 置 ， 

Was URAP ARARA ТЕМЕН, EE MÁS w WR. EH Ss 
Ag 3: "a Дүн Ха], Ек. 是 最 高 有 效 位 ， 而 x, К+. Кш w 是 8 的 信和 数 ， ЫЫ ДЕН 
A HH USA S. Hop WA iY S xa 6 з]. mh xr ЛА Дх. x, cns 
ay]. Rh rtu Arp firn. Е b po UL CE CE ІНЕН ТІНІН 
КРО, i5) ЕО ИЕН ULM Ag CE Wa MCI КҮПНЕ ЕДЕМ. dE] EIL RE 
TUSCE VETERE ILES АЕ Е АА Ж: (title endian) X: £ 8839 H ШЙ) Digital Equipment £8] CI 
在 是 Compaq 公司 的 一 部 分 ) 的 机 器 ， 以 及 Imel HEERA. EA OBL EE 





| 情 息 的 表示 和 和风 理 29 
TSECRRBEIRLEEI 2. ЖЖ C (Ы; endian). ІВМ. Motorola 和 Sun Microsystems MA £ 80 k1 8 
都 采用 这 梓 规 则 , TERTRE eR". 这 些 规 则 井 设 有 严格 棱 照 从业 界限 案 划 分 。 ЕШ, IBM 
制造 的 个 人 计算 机 使 用 的 是 Intel ЖЕНЕ, EREA. ТЕЙКИНЕН. ыҚ Alpha 
和 Motorola 的 PowerPC, liliis Е [£— Rl sep, 其 取决 于 4 Hr inn era Re PE TRIER 

ЖЕКЕ ПГТ. HRPE x 类 型 为 int， 位 于 地 址 OxI00 Ж. У-Н ГЬ 
0х01234567. ЖЕ Ox 100—0x 103. 8) 35 UE ВЕ А Ж Ж. 

大 端 法 





小 讲法 





注意 ， 在 字 0х01234567 h, dr TEACHER ші, iE Or 0х67. 

ҒАНЫНА, ЕАР ЕРЕ ТА ЗА НЕЕ, АГЕ ЧЕНЕ ЕЕ, Ж}. 术语 
"lite endian (小 编 )” 和 “big endian СӘ" 3 ËB T Jonathan Swift A) (НЫНА (Gulliver's 
Travels )}， 其 中 交 城 的 两 个 汰 出 无 法 就 应 该 从 加 一 洋 一 一 小 端 还 是 大 庙 一 一 打开 一 个 半 热 的 网 重 这 
成 一 到。 芒 像 鸡 重 的 问题 一 样 ， 没 有 技术 原因 来 选择 字 节 顺序 般 则 ， 因 此 争 容 巡 化 成 为 关于 社会 政 
EARO. {нү ЕНШЕ ЕИ. 


s m. sS ын BASE == S T — Е XE 
EXT tia uer i omis ИШ. Fro PRESE T. "TT 
‹ 1 , ubi. Ld c E 4 E 
Е" 4 "LS Wn] 








i 
CM a = 
k "mr Ж Т dhar. | 


| 
е тешер UM м. Ы 
p Za citg ay ua OL n 
y Ik. aar E ЕЕ i 4 
| —— ƏЙ. 1 d zl P í Pe 4 : 
жт те] | г š 
Ы mi D " Ё С ғ L š 
^t E BM ғ 
a auicm d ДӘМ” ^ ` т. : 
ЕЗ EE ki LE ue rh ж m KH k. " 
"E - ғ ' р ; N 3, ， 
б ЛТ ЕЕ ЧЕ Oo š 
ят m” 局 | i . + 
, > , ` Ec E - 
4 0 | ^ T 
t ы a 






| ҰҒХФКЕЖЕЖЯ ЖА, ШЛА SOROR. КЕЛБЕТ 
ЕОР MH MER. ИНИ. ЧЕ ИЕА, SAEI IAS D OH 
fap if ist р Pis fleo НЕН. жн ED EAE PE MR НЕН ЕЛИ 
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FERE ZH., RICE SRI, TMZ Т RUE. ЗІ йа, ман ЕН ИҢ 
F 5838 Cm TE WW FI D. ІВЕНЕИЛЦИҒЕНЫШЕ О ДЕЕ НЕ, m 
deut f Ha FERE SEC EP BER. МІЗНЕВ 12 章 中 看 到 这 种 转换 的 例子 。 

学 节 顺 序 变 得 重 厂 的 第 二 种 情况 是 当 阅 读 表 示 整 晤 灼 揭 的 字 节 序列 时 。 这 通常 发 生 在 检查 机 器 
额 程 序 时 。 作 为 一 个 未 由 ， 从 某 沾 支 件 中 摘出 了 下 面 这 行 本 码 ， 该 文件 给 出 了 一 个 鲜 对 Intel НЕ 
ЕНЕ Уу Ж ОБ: 

804Bi1bd: 01 05 ба 94 J4 09 add *eax, DxBOd9404 

这 一 行 是 由 反 汇 蝙 器 【disasemhlery ЕНІП, БЕЛГШ JE Shikin] UH RETE ЖӘТІНІН 
学 序 列 的 工具 ， ЕПЕЕЕ-НФЕФЕЛИХЦ ШЕТ ДЕЕ ШИН. ШЕРИ ЧЕ EH MT. mA 
E ЖПЯЖТ Ж АТ ЖТ ARWR o 05 69404108 R ОУУ WR т. ЕЖ 
yK MII P FR OE МЕ ЕЛІ (x8049464 的 秆 上 ， 如 果 我 们 取出 这 十 序列 的 最 后 四 字 
B: 649404 ОВ, ЕЕ НЕ НЕШЕ HH, IIRA OR 04 9464, А Е, ВОЗЕ, ДИНА 
üx8O49464, SEE ia EE LEAL. SAREREA 1 Е ЯН ЕЕЕ ЕНЕШ ТӘН. Ж 
"zz АЧ НЕ ШС yñ В ЖОЛА ЖЕ h ik, ПЕД ЕТТЕ 
tij, HE A Es Eh АН Wy ЛЕШ). {ЕН ЖИЕК ШЛИН И m. 

ЧАРЕ SE ELS RC БЕ ИЖ ЕЖЕ Ж SIE ТЕН. Ж США. ҮШІН 
mH О А (cas ТЕО АЕ BGDENEEqESESIH— T WA. КЕК 
WRISREREIGR TERERAA. {н ЖЕЕ {ПИ SS ii ЖЕ EJ NER, КЕЛ, 

озш ГВС, CERSA КЕЕ ЖШ ИТЕ ЖЕ ЕЕЕ. RT 
用 typedef ЖЕЖ byte. pointer 定妆 为 一 个 指向 类 型 为 “onsigned char" fp unito. iH — 
个 字 节 措 特 引用 一 个 字 节 序列 ， 其 中 插 个 字 节 都 被 认为 是 一 个 非 负 束 歼 。 第 一 个 例 程 show_bwtgs 的 
WAE- AEIR СЕН TOT Bt MAPA. show bytes 打印 出 以 十 坟 
ibd ME. CHE T «xx denm E NTHECENWRTTAGEBIBSCRUH. 


冶 心 语言 初学 者 ， 使 用 typedet 来 市 名 数据 类 型 

C 中 的 rypedef EART ЕВИ dr Ep. üa kaka nem B Ж 
WA EUST. 

typedef rib 35 Band d ond. ETSRSRAASE, алАатЖжі. Bit. в 23% 
byte, pointer МЕ 814036 Е 0835 Ж "unsigne | 

Ht., EH 

typedef int *int pointer; 

int pointer ipi 

ЖЕШ "int pointer" $35 — fm im deer. EASTER SM Ti. &INETO 
IE FL EERS ET 


int тір; 








|  code/data/staw-bytes. c 
1 tinclude «stdio. 
2 


| Hu. n Ж ет. 31 
i typedef unsigned char *byte pointer; 
4 
3 vcid show hytes(byte pointer start, int len) 
ЛЕ 
7 int ir 
d far (i = Ü; i < len; i++] 
3 printti" &.2x*, start[il]: 
10 printf(*'An*); 
ii 1 
12 
13 void show intíint x) 
14 1 
15 show bytes((byte, pointer| Ех, sizeof(iint])! 
16 ] 
12 
18 void show floati(float х) 
19 ( 
20 show hytes((byte pointer] вх, sizeof(float)); 
21 ] 
22 
43 void show, pointer(void *x) 
44 1 
25 show bytes((byte pointer) &x, sizeofivold #) 1; 
26 ) 
UU — —— codefdatafshoew-Bytes.c 
H23 打印 程序 对 象 的 字 节 表示 
Анаам ижин Ен. 


тҮ TEE, Ë A 3 
"А Á 5% к L 4 T чі. " 
a л FEM алаш " ' 5 

L E Л | 1 К 


еі E қ 








me T rupe Kuka "Ñ | ET А; 84 k š li. "AC LM n | | | y, | a 
过 程 show int. shewwe float 和 show, pointer 展示 了 如 何 他 用 祷 序 show bytes 来 分 别 输出 类 型 为 
int. float 和 void * C 程序 对 象 的 字 节 表示 。 可 以 观察 到 它们 疏 仅 忧 过 给 show. bytes 一 个 指向 它们 


32 | x24 
SN IHE ШАШКЕ ШЫЖЕ 8 “unsigned char е", iX 59 fib d ER He P UHR HE A 
Wn siw ЧЕН ЖЕННИ ЗӘРЕ, TER T THESE MM. ЖБ. ІН 
ЕЕ I si K TI He АЕ, 
të CES. qute doi ES 

在 图 234 15. 20425 7, Adi Ce Cet AREIA RA. Cif "ORAE" 
ЖНАЕУ, Eu = rp. Ki Жах 市 建 了 一 小 指向 保 青 变量 xb ECT, ik l 
HAS SRI x R, Нис d RS P int. fotte void**, (EXEC voidt £ 
ЖН, ЖЖ st 

84A t dd ИЛЛИ ВВЕДЕНИЯ. Ей, EE зуге pointer] 
kx kna thay ЖААШ. CEU RUE dp ACIE 3 unsigned char М1. 


КЕШЕНМЕН C 的 运算 符 sizeof RE ИШЕТ. —WKIB. ЖАЗ sizeofr Tii [B| ff 
ВТ t T Pip ЕЧЕИ. PERI sioi mE Bl Ri. Sn EIL 
Xm parse dt suus: T —. 

ЖЕЛ А-Ы) ЕТШ ағат, БІНЕН 25 ІНІ. NUS T EL кН. 

Linux: Imel Pentium II 1:17 Linux. 

NT: Intel Pentium II iz ^T Windows-NT. 

Sun: Sun Microsysrems UltraSPARC iz (T Solaris. 

Alpha: Compaq Alpha 21164 iz fT Tru&4 Unix. 








一 codeAdatuskaow-byres.e 
vold test show bytesí(int val) 
[ 


1 

ғ 

1 int іуа! = val; 

1 Float fval = ( оа} ival; 
5 int “руа! = Біча]; 

Б show іле(іча1); 

7 ahcw float(fwal);: 

E show, pointer /(pval!: 

9 


code/data/show-hytes,c 
Ш 24 宇 节 表 示 的 示例 
НЕ ГИЖЕ АНТ W т. 


BATES W 12 345 HHA o Ox00003039, HF im ЖШ КЕШ. ТЕЗҮЛЕ. 
我 们 在 所 有 机 器 上 独得 到 相同 的 半 果 ,特别 地 ， 我 们 可 以 看 到 在 Linux. NT 和 Alpha |. MEHA 
ТОЙ 0х39 最 先 输出 ， 这 说 明 它们 是 小声 法 机 器 ， 而 在 Sun 上 最 后 输出 ， 这 说 明 Sun AAEH 
wn. ША. Пош 类 型 的 数据 ， 除 了 字 节 顺序 以 外 ， 也 都 是 相同 的 ， 另 一 方面 ， 描 慎 值 却 是 完全 不 
BI). TED ELSE ЕНИНЕН Fu] n] fü pO IU. 一 个 值得 注意 的 特性 是 Linux 和 Sun 的 
НЕНІ, my Alpha НЛО. 
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EF bf 
54 02 
Ес ad 
Е | tt 1f 01 00 00 02 
图 2.5 ЖЕ ЕШР SEL 
ГЕ int 和 Dear (ERE — 1. IRtHWR ELE ER. 
AUREN. КЕЛАНБТЕЕПЕНЕІІЗ 345 Ц. ELE EU ЕЖЕ S HR, 
EON Ox00003039, TTL Oxd640E400.. WMA. ХЕШ IH RISI, img 
TERRAS TARRI ИА ІНЕ, EEG AE ETE I. ПЕШ Д 13 个 相 
MERHER., du Pi) — А iB: ЖЕЕ. 
0 0 bb о 3 0 3 9 
YDpaDüpaDODODODODOD1l1000DODI1l10DQ01 


жжзізізіештна 
¿ 6 á ü E 4 Q Ü 
01000110010006001110010000000000 


WH Ay, SERIE BERTA ЖАНЫ SERT. 











思考 下 面 时 show byes ñ = 个 调用 ， 

int val = 0x12345678: 

byte pointer valp = (byte pointer) &val; 
анам bhytes(valp, 1); /* A. */ 

show bytes[valp, 2): /* B, */ 

show bytes(valp, 3); /* C. */ 


ThkdpkRmBdi/akexEE 4 HAMGH. 


А. Ж: Xi: 
B. "5; X ik. 
C. dE. kk. 





' | ҮТЕ ПАКТ = k a Ta ba a uic 
өл — йт. Йй, BUT] MAE ЖЩ 3490592 d içi RA 0x00354321. i$ c 
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3490593,0 H T 3 si T 39 Ox4ASSOCRA, 
A. Sik rcd M s. 
B. PARAH ФНЧ K. OM lis К. 
С.ЖЕЗНДІНЕКЖ?! фе ФУР tang 1 
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C 中 的 字符 囊 被 编码 海 一 个 以 mel CEA AE 字符 结尾 的 字符 整 组 。 每 个 宁 符 都 由 某 个 标 
dE Ed. 最 常见 的 就 是 ASCH FAG. E. ШЕНІПШЕН “12345” 6 (ЖО 
ЖЕГІН show byes, ЖЫП БЕШ 31 3233 34 35 00). ШЖ. ТЖ ШҮ r J ASC 码 正好 
是 Ояз. (ñE Fe ET GRE И ту А Өкімі, {ЕТЕШ ASCI РҮ S TERRE EE RE ЖЕ ІСТЕН! 
ЖЕЕ Ж. НҮНЕИННТХАНЫЕА Хх. НІП, ТЕКЕ ЖЫ ЕНИН ТЕКЕШ 
性 。 


Si. tH —5 ASCI Ж 
T Li BE BUE AG man ісі АЯҢ-Ж АСИ SF ERR k. 


85127 

下 面 对 show bytes Fr Ж АКЕ АН Ж? 
char *& = "ABCDEF'; 

Fhe byteg[s, sEEléenís)) 


ЖЕЖ CAT = "Z^ ñ ASCIH Ж 0541 -0x5A. 


ж. Unicode СИНВЕ ) 字符 集 

ASCI CAE 2 Tiu d de, ЛТА АИ Аа tgp rx ET ЛЖ. Wik 
We "CU. ЖЖ жЕ Dd IHS, ЗАНЕ Ч bu Had cds, Же. 164205 Unicode FHS 
МАМЛА НАЕТ НА ат ЕЕЕ КОНЕ К ЖЕНЕ НА ЖГ. Java 
dti W Ik W Unicode ЖЕФ. яр TEE EN 
didt, Os strlen 和 strepy, 
21.6 ”表示 代码 

ЖЕ ril СӨЖ: 

1 int Bum[int x, int y] 

3 return Xx + y; 

4 ] 

ЧЕДИП ЛИН FREE. RERA m EET Ж кН 

Linux: 55 359 e5 ЯҺ 45 бс 03 45 DB Hü pc 5d cå 

HT: 55 99 е5 Bb 45 бс 03 4*5 DB 89 ec 5d c3 

Sun: 81 Сі EO 08 90 02 00 03 

Alpha: 00 Dü 3D 42 01 BO PA БВ 
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这 里 我 们 发 现 除 了 NT 和 Linux 机 器 以 外 ， 指 令 编码 是 不 同 有 的 。 不 同 的 机 器 类 型 合用 不 同 的 且 
不 兼容 的 指令 和 编码 方式 。NT 和 Linux 机 器 使 用 的 都 是 Intel 处 理 器 ， 因 此 支持 相同 的 机 器 级 指令 。 
Жї. EmMa. ОАТ NT 程序 和 一 个 Linux 程序 的 结构 是 不 同 的， 因此 这 些 机 器 并 不 完 
全 是 二 进 制 慕容 的 。 二 进 制 代码 很 少 能 在 不 后 机 器 和 操作 系统 组 合 之 间 移 植 。 

计算 机 系统 的 一 个 基本 概念 就 是 从 机 器 的 角度 来 看 ， 程 序 仅仅 只 是 字 节 序列 。 机 器 没有 关于 原 
始 源 程序 的 任何 信息 ， 除 了 可 能 有 些 用 来 帮助 调试 的 辅助 表 以 外 。 当 我 们 在 第 3 章 中 学 习 机 器 级 纺 
程 时 ， 将 更 清楚 地 了 解 这 一 点 。 
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因为 二 进 制 值 是 计算 机 编码 、 存 储 和 棵 作 信 息 的 核心 ， 所 以 围绕 数值 0 和 + 已 经 演化 出 了 丰富 
的 数学 知识 体系 ， 这 起 源 于 1850 年 左右 乔治 布尔 (George Bode) 的 工作 ， 因 此 也 被 称 为 布尔 代 
Җ (Bool aigebra)。 布 尔 观察 到 通过 将 二 进 制 值 10 ABA Е TRUE. СИ) 和 FALSE【〔 假 )， 
能 够 设计 出 一 种 代数 ， 研 究 命题 逐 辑 的 属性 。 

存在 大 量 不 同 的 布尔 已 数 ， 其 中 最 简单 的 是 定义 在 二 元 素 集合 {0，1] 基 础 上 的 运算 。 图 2.6 
定义 了 这 种 布尔 代数 中 的 几 种 运算 。 我 们 用 来 表示 这 些 运 算 的 符号 是 和 的 位 级 运算 使 用 的 符号 
相 匹 本 的， 这些 将 在 后 面 讨论 到 。 布 尔 运算 “对 应 于 负 辑 运算 NOT， 在 命题 逻辑 中 表示 为 一 。 也 
就 是 说 ， 当 P 不 是 真 的 时 候 ， 我 们 就 说 一 P 是 走 的 ， 反 之 亦 然 。 相 应 地 ， 当 了 等 于 0 时 ， 卫 等 于 
1， 反 之 亦 然 。 布 尔 运算 点 对 应 于 遇 辑 运算 AND， 在 命题 罗氏 中 表示 为 和。 当 P 和 0 都 为 真 时 ， 
我 们 说 PAO 成 立 ， 反 之 亦 然 相应 地 ， 只 有 当 pl Egl 时 ，p&q 才 等 于 1。 布尔 运算 | 对 应 
TRAZA OR， 在 命 古 迎 辑 中 表示 为 Y 。 当 P 或 者 0 为 真 时 ， BTR PVO 成 立 。 相 应 地 ， 当 
р=1 或 者 g=1 时 ，p | 9 等 于 1。 布尔 运算 ^ 对 应 于 册 辑 运算 EXCLUSIVE-OR ( 异 或 )， 在 命题 逻辑 
中 表示 为 8 。 当 或 为 真 但 不 同 为 真 时 , 我 们 说 P80 成立 ; EAR, Шр-і B деб, 或 者 pe0 
А. а=1 时 ， pg 等 于 1。 


2.6 布尔 代数 的 运算 
二 进 制 入 IB 0 ЮР (Н TRUE 或 者 FALSE, ПЕ И а. 和 六 情况 表示 逻辑 运算 NOT. AND, OR 和 EXCLUSTVE-OR。 


后 来 创立 信息 理论 领域 的 Claude Shannon 首先 建立 了 布尔 代数 和 数字 忱 辑 之 间 的 联系 。 在 他 
1937 年 的 硕士 论文 中 ， 他 表明 了 布尔 代数 可 以 用 来 设计 和 分 析 机 电 继 电器 了 网络。 尽管 从 那 时 起 计算 
机 技术 已 经 取得 了 相当 的 发 展 ， 但 是 布尔 代数 仍然 在 数字 系统 的 设计 和 分 析 中 扮演 着 重要 的 角色 。 

在 整数 运算 和 布尔 代数 之 间 有 许多 相 羽 点 , 同时 也 有 一 些 重要 前 不 同 之 处 。 特别 地 ， 整 数 集 合 ， 
用 鳃 来 表示 ， 形 成 了 一 个 称 为 环 的 数据 结构 ， 表 示 为 <Z，+， x, -, 0, 1» АФПИАЛЖЖЗАЯ, 
XA ЖЕЙ. 负 号 作为 加 法 的 道 运算 , 而 元 素 0 和 1 作为 加 法 和 乘法 的 单位 元 . 布尔 代数 <{0,11， 
|l, &, „О. 1> 有 相似 的 属性 。 图 2.7 突出 了 黄种 结构 的 属性 , 展示 了 两 者 的 共同 点 和 各 自 独特 的 属性 。 
一 个 重要 的 不 同 之 处 就 在 于 аЛ Жа 在 | 运算 下 的 逆 元 。 
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RB FU B dens {= Sit TEK H YE К AH, At, — Ri EM E 3 4— 
und. EdXabEXN 6—RTREHGLE. ki, ERE A MIA IHE, ЗИ п, IURE 
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如 果 我 们 用 EXCLUSIVE-OR 运算 来 取代 布尔 代数 中 的 OR ЕЙ. EHI EN t identity 
operation? Г SERE fU EHE BU. ЖАН ЗЕН а. Да-а, 那 色 我 们 就 得 到 ЦО, 1), ^, & L O, 
I». ТЕТЕ ЛО, ER ER PER. ЕШБЕНЛ-ВИНИЕНЕШЕНЙ, m 
ШИГЕ 0,1, o n- ЗАА, EH Ini RISE ELEME n. ENT, BTE п-2. th 
就 是 说 , 布尔 AND 和 EXCLUSIVE-OR 489/40 5 H 2 的 乘法 和 加 法 。 这 中 代数 的 一 个 奇怪 的 属性 
КИ, FT EERE BOE X. a Қа)ға"ат), 

Si MTESE. PARALARI? 
SkF- СО ЗЕН EA d—& DVD BRuAREARMARE, Arb e d 


MERE, хченянантыңыыяд EIE RUE, PERRA b FENNA. ik abi 
HR CE Ead SEMA НА, p" 


R ERRE PUR i RIT RU Beg L. (rp MERE AE E Ew iO ІН, 
BAR Hr EE IB НСА EIE L. xeu gr nie Ж. МШ. RE X [ass 
Gp o. СЕ КР by] 23 [a,. bs. úa. kb... т, ау). 时 于 运算 | 和 3628 el 
МЕЛ. HHO 1"dosBoS ES wd 0. 105038. Ша' Ж жн HE Sa URSUS, Я 
ЗЕГИН РЕВО K. e0 D)". L &. `, 07, (0, ІР, ^. А. L 0 г, + 
ЖЕ ТЯ uM АНЕ, t- AFAM w NELT- Minkana uda ТИВ, 
ян. ЛЕНИЕ idum: | M Е: 

Я йс. 1). ^ & I, 0, БЕЙ 22, + х„ - 

ж, ADHERA онаа, dS MGE АИК, 







53 28 21 
Ялта. ша deo ie НКЕ. 


^ 


| [011036061 | 
[01010101] 





ШИШ ТАА ROSE АЯ E KNSS. Bin, RIESA >. а. ав 
ЖЕН PIRAEI 1, s wl]. Kal" Аге А, Bin, GOERTIEP а. BEEN. 
而 将 西 写 在 右边 h 我 们 有 a = [01101001]46 354 A = (0,3, 5, 6], (ü b= [010101017 B = [0, 
2, 4, 6). ШН, Алаа OD RUNS ЕО, s us ЗЬ. Ha, z 
W a&b 科 到 位 向 量 [01000001], 而 ANB= 0,6]. 

keL PEARS S. BR (Anun, 85) IRT AIR. Rh жуй 
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ОА, 而 表示 集训 的 补 运算 符 , 也 就 是 说 , u FIT А. ОЗНА A =la 

є Slae Ар. HUM W kk RU НЕЗА РВ HR. EER RARIOR ЕНІН. 
练习 显 2.9 


ЗЕЕ, е0, #2 Е, )， 计 算 机 在 视频 屏 摹 盐 者 流出 显示 器 上 产生 各 志 
HER. АНДА ТЬ, ӘЖіМТЕНАНЯ, Scams xd. I uo AE E. 
x каз 





ТААТАЙ ЕЕ) G 89) BUR) xi [0) ЖАТ (1) ЗИНА 












id. 
| R B | 
| n 0 m 
| G 0 : EA 
ü | ü мМ 
| il | 1 Bum 


LERE SEAT- AREE EAR. 
А. HREN AEKA AEE, ПАТИНА EANA, Таһа 
# di АЛЯ ERE Н 7 
B. ST ERU, GEO eO "sr W iG. 3 ELT 
C. жиё s| B n кїй Em, 
йа, | ird " 
ktë а EHE 
A ^ ай, 
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C 的 一 个 很 有 用 的 特性 就 是 它 支持 按 位 布尔 运 特 ， 事 实 上 ， 牧 们 在 布尔 运 特 中 使 用 的 邢 些 适 号 
SEE C PERR: ДЕ OR. ӘЙ AND. “WE МОТ, БН EXCLUSITVE.OR。 这 些 运 体能 
下 用 蜀 什 何 “ 蓝 型 ”的 数据 类 型 上 ， 也 就 是 ， 那 些 声 明 为 char 或 者 inc] Es ЖӘНЕН 
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short, long 或 者 unsigned 这 样 的 限定 词 。 以 下 是 一 些 表达 武 求 值 的 例子 ， 









_ сю | SIL | ^ cR | 
menes | misma; 


ERARA, ае ОДЕА А РЕА 22211. 1.22 1315 
们 的 二 进 制 表示 ， dt; ibis NN. Pie a 2383. 


ЖЭ 2.10 | те 
ATAF ARARA Жк. 























| void inplace swap {lint *x, int +y) 
à 1 

3 "X = *x "o*4. gr Step ] */ 

4 ty = "x ^ +y /* Step 2 */ 

7 *x = wx “оту; ре Spam 3 */ 


6 | 
аналык АНЕ A НДЕ EE HE E х 和 y ЖЫН НАШ 
ЕКРАН, Gd. Bade A ILEX—H. алтан, ANERER 
ПКА AH TE. RARR RARER НЕ, а d HER EHE. 
TM, BE x de y ИН КАНДИЛ ade b. ESTA, UR px 
B. PRERA HIE THER. АДНА А ИЕ НТ. ин-т, Git 
HETARA (АКИ. asa= 0), 
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ыы ME — 2% 
IAT ЧЕ, 4% r=Dx98FDECBA ## K Ж NGHAR, EC if d ik x, 
ЕЕ Т.Ж 


жи? 
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А.х 的 最 低 有 效 字 节 ， 其 他 位 均 置 为 1[0xFFFFFFBA]. 

B.x 的 最 低 有 效 字 下 的 补 ， 其 余 字 节 保 持 不 亦 [0x98FDEC45] . 

C, 除了 x 的 最 低 有 效 字 节 外 的 所 有 字 节 保持 不 蛮 ， 最 低 有 效 字 节 置 为 0[Dx98FDEC00]. 
尽管 我 们 的 例子 假设 的 是 各 位 字 长 ， 但 是 你 的 代码 应 该 可 以 工作 在 w>8 的 任何 字 长 下 。 


练习 题 2.12 


从 20 456 70 年 代 末 到 80 年 代 未 ，Digital Equipment 的 VAX 计算 机 是 一 种 非常 流行 的 机 型 ， 
CHAA RER AND 和 OR 指令 ， 它 只 有 bis (zik ) Æ bi (位 清除 ) 这 两 种 指令 ,两 种 指令 的 
输入 部 是 一 个 数据 字 x 和 一 个 掩 码 字 m。 它 们 生成 一 个 钻 果 z, z 是 由 根据 撞 码 m 的 位 修改 x 的 位 
得 到 的 。 使 用 bis 指令 ， 这 种 修改 就 是 在 四 为 1 的 每 个 位 置 ， 2 ЖЖ), ӘЛ bic 指令 ， 这 种 修 
改 就 是 在 m 为 0003544453. V uix. 

我 们 想 要 编写 Сй bis fe bic 米 计 其 这 两 个 指令 的 效果 ， 使 用 CC увя К, жет 
中 缺失 的 表达 式 ， 


іє Ви Set */ 
nt bisíint x, int m) 


№ Write an expression in C that computes the effect of bit set */ 
int result - : 
return resul-; 

| 

/* Bit Clear */ 

int biciint x, inz m) 

; 

L 
Ё Write an expression in C that computes the effect of bit clear */ 
int result - ; 
return resul:; 


| 


2.1.9 C PRERA 

CRET- AIRAA ЖОН. && 11, ОМ dp 0) OR. AND #l NOT 运算 ， 
Sue SR E ЛИУ Нан Най, BEEE ЖЕН. ae А ETE AESE RH ӘЖ 
ET TRUE. ІІ ЖЕ 467 FALSE. CHRI REO ALEGRE TRUE i Ж FALSE. 
以 下 是 一些 表达 此 求 值 的 示例 ， 
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BUR W P|. ЕЙ EUR ESPERE ЫТ. БЕИ 0 E ІН, dS CE 
жне Т ЕНТ. 

ЖЕНТ ШЕ ЕПА Pi rimis rem HS xxm. pores 
ОИЕ УЕ ЖАЛЫН, ЖАШАИ ЖЕЧИ HEFTE. Eit. Piin. ust акд 
J nib. WR paa рн ЖЕЛЕКТИН. 

ЕЗ 2.13 Ti 


Ti x de y AFTRA 0x66 和 0393, ASTA, W s C ku Кё ҮЙ. 





1214 : р, ELS o jJ ыт 


ЛАА И, W t-t C kaki. EFH ну. AGGER, dreyt 
ipi |, ФИН 0, 


2110 C PHREN 

С Г RE E GEN. ELE Zone ape Bao dt. F-ART A s nsns 
ху ах, CRER x ec k ERHI УЖЖ, uas nues қы б.+=. QJ. ЕЙ 
iX. x NEREA ti. Ek RAR PEENI T b 0. PARERE T 0—п-1 之 间 的 
ii WERN ERSS, МШ xexjeck Реј, НЕЕ ИРИНЕ Е. 1<<5-1 Hi 
TERI 1<<(5-1)0 ЖД 1<<5)-1 来 求 值 。 

AENEAN х >> 上 但 是 它 的 行为 有 点 司 妙 。 一 般 而 言 ， 机 器 支持 再 种 形 臣 的 右 秘 ， 
Жн Ж. ЖШШЕ Ta ET 0. ир арЫ e, Ü, nos Xeno nh. ИЖЕ 
是 在 A383 k ННІ DU, 得 到 的 结果 是 [i [# 778 1,1, Ng ри Даз "t Xal ЁРЕ L 
去 可 能 有 点 奇特 ， 但 是 我 们 会 发 现 它 对 有 符号 кшй ит. 

C 标准 井 没有 明确 定义 应该 司 用 嘎 种 类 型 的 右 移 。 对 于 无 符号 数据 【也 就 是 ， E ER W i] unsigned 
Pig menter Seo. ЖЖЖИ MES. 而 对 于 有 符号 数据 (RU ЖЖБИ. 
TER Ж@Ж= RE Esth Е ЕЕС СА ЕН ЕЕН п ЕНЕНЕ. Ж. 
ЖЕ. ДЕНИ ПЕШЕНЕНЕ EARR ЖЕН, НЕЛЕ DUE HERE 
LET: 

Э 215 ыта" ` 


ШЕТА. АТЕНЕ НЕИН. ZISRREZARSJARARA-ASQAS 
TA. RRHH, AALER, KeRdpcHAR TEM. ФЕЕЖЕНІЙ 
А ГЕТЕА ГЕЯ 
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BEEN X««3 X>>2 х>>2 

EE 1:28 С Ж) 
ҚАНЫ oža | 二 进 制 +АШЫ | ы ы 
>ó | | ] 





22 整数 表示 


仁 本 区 中 ， 我 们 描述 用 位 来 编码 整数 的 两 种 不 同 的 方式 ， 一 种 只 能 表示 非 贷 数 ， 击 男 “种 能 够 
表示 负数 、 夫 和正 数 。 在 后 面 我 们 将 会 看 到 它们 在 数学 属性 和 机 器 级 实现 方 徊 有 很 强 的 关联 。 我 们 
还 会 研究 扩展 或 者 收缩 一 个 已 编码 整数 以 适 点 不 周 长 度 老 示 的 效果 。 


22. 整 型 数据 类 型 

C 刀 持 名 种 整 型 数据 类 型 一 一 直 小 有 限 缉 转 的 整数 。 这 些 类 型 如 图 2.8 所 示 。 每 种 类 型 前 有 一 
个 大 小 指示 符 ; char. short. int 和 long, HAEA RETHA T E EHA unsigned), 或 者 
可 能 是 负数 默认) 的 指 和 未 。 图 2.2 中 给 出 了 对 这 些 不 同 的 人 小 的 热潮 分 配 。 如 疼 2.8 所 于， 这 些 
ARRA TIRT TAWAR. C 标准 定义 了 每 种 数据 类 型 必须 能 够 表示 的 最 小 数值 范围 。 如 
RRA BAR СИИ 16 位 的 表示 ,得 一 个 典型 的 32 位 机 器 使 用 -个 32 位 表示 来 表示 mt 和 
unsigned 数据 类 型 。 像 图 2.2 所 描述 的 ，Compaq Alpha 使 用 64 位 宁 来 表示 long 整数 ， 无 符号 数 的 
上 限 超 过 六 1.84x10“”"， 而 有 符号 数 的 范围 超 过 了 49.22 x 10, 





char 


unsigned char 


33 761 
65 533 


2 147 483 647 -2 147 483 648 2147 483 64) 
4 294 963 295 0 4 294 967 295 


图 2.8 СЕНЕКА 
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ЕСЖНЫЗЖ. C. Ce Java PES SEE OX TERN 
C 和 C++ 都 支持 有 符号 【 软 认 ) 和 无 符号 教 ，Java ВАНА МА. 
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222 无 符号 和 二 进 制 补 码 编 三 
Bü TENNESSEE w 位 。 我们 可 以 将 位 向 量 写 成 ， 表 示 上 整个 向 量 ， 或 者 写成 [x 
ын, del 准 不 同 量 中 的 报 一 位 把 # 看 散 一 个 写成 二 进 制 表示 的 数 ， 我 们 就 厂 得 了 НЕН 
表示 我们 用 一 个 函数 MU, [代表 “无 符号 的 二 进 制 "， 长 度 为 w) ЖОАН ИХ. 
B2U „(х)& 9,2 (21) 
i=} 


ERTSE, HS “а” ЛЕЕ УЯТ Т. АНЫН, - TEES w I8 0. 
| mma Bd SE. CHR ШЕННЕ ЕЮ 0]%:. GAER 0. її ЖИН 
向 量 [11…1] 表 示 ， 也 就 是 整数 值 UMar, 二 02 =2°"-1. ін, Ж B2U, БЕЙИЛ ^h 
M B2U,:(0. 1], [0 ^, 2°-1}. 注意 B2U, 是 一 个 到 射 一 一 对 王 角 一 个 长 度 为 w 的 位 向 量 ， 都 有 
一 个 惟一 的 介 与 之 对 应 ;， 反 过 来 ,在 0~-2-1 之 间 的 丢 一 个 整数 者 有 一 个 惟一 的 长 度 为 六 的 位 商量 
—dH Bid sc ES. 

对 于 许 才 应用， 我 们 还 希望 表示 负 融 值 。 最 需 见 的 有 符 导数 的 计算 机 表示 方式 就 是 二 进 制 补 玛 
(two's-complemeat》 形 式 。 它 的 定义 特 字 的 最 高 有 效 性 解 县 为 负 权 Cnegative weight)。 我 们 用 函数 
B2T, 【表示 “二进制 到 二 进 制 补 码 "， 长 度 为 w) ESTE Н. 


B2T (0) = -x 2 XT. (22) 
"EN 
最 高 有 效 位 也 称 为 符号 本 (sign bi. SEQ R H, тй ЫЙ. mE ENCORE OR. 3 
非 负 ， 它 能 表示 的 最 小 慎 是 位 向 量 [10…0] :也 就 是 ， 设 置 这 沾 位 为 负 权 ， 但 是 清除 其 他 记 有 的 性 ) 
CERA TMn, 二-2” 。 而 最 六 值 是 位 向 量 [01-…1]， 其 棘 数 信 为 TMar 8 Y д 227 -1, 


同样 地 ， 我 们 可 以 看 到 MT, 也 是 一 个 双 射 82U,:[0, =j- ++. 27-15, ЖЕ # ЖИР ES 
EET THURIS HEIDE Sum. 


c RENE Т, 





ІНДЕ wed, ЖАЛЫН ктей-ханаз T— пах KARSA синя 
MR F, АЕА Z. Як 4 ¿l Ф272 Ит Kipa K pim ER, МЕТА, 





图 29 展示 了 平 同 字 长 的 几 个 “有 趣 的 ”数字 的 位 模式 和 数 伯 。 前 三 个 给 出 的 是 可 表示 的 整数 的 


44 82% 


TB. ЛАН. 第 一 , 一 进 制 补 码 的 范围 是 不 对 称 的 : ITMin,| = (Мах, + 1, 18414, ТМіп, 
没有 与 之 应 的 下 数 。 右 像 我 们 会 看 到 的 ， 这 导 禾 了 二 进 制 补 码 运 算 的 茶 些 特殊 的 属性 ， 并 日 容易 人 
成 程序 中 细微 的 错误 。 第 二 ， 最 人 的 无 符号 值 刚好 烤 二 进 制 补 妈 的 最 大 值 的 其 们 大 一 点 ;UMax, = 2 
TMaxw+ ]。 这 是 因为 二 进 制 补 码 表 水 保留 了 一 半 的 位 模式 米 表 小 代数 值 。 其 他 的 情况 是 常数 -1 RIO. 
注意 -| 和 UMax, 有 同样 的 位 表示 一 一 -个 全 1ЙИё. 数值 0 在 两 种 表示 方式 中 部 是 全 站 Т. 


T w 





ÜxFFFFFFFF ÜxFFFFFFFFFFFFFFFF 
4 294 967 295 18% 446 744 073 709 55] 615 


Сх?ЕРЕ ÜxTFFFFFFF Üx/FEFFFFFPFFFFFF? 


32 767 2 147 483 647 9223 372 U36 854 775 N07 


DxROgDOOp DxB000009g0000009000 
-2 147 483 643 0223 372 (36 854 775 SE 
ÜxFFFFFFFF ÜXxFFFFFFFFFFFEFFFF 


üxd902020420 Ио АН 


Ң 29 “有 趣 的 ”数字 





em J XGA АЖ Ыл. 


C fps EC A =k EET) O AHI АЖ ЯН TES ЖШ, АЕ Л ЗЕТЕ НУВ АЕ ОХ 2 48 
HU. A THIRE At КТЕ 2.2 Вл ЕЛП Ж. RATIS RAO ERI nA E 
(Eve. к EIN RS. СЕНИ fimi» 7-Яжы, BOT 58 ER 
的 这 台 机 器 的 不 同 整 型 数据 类 型 的 范围 ,比如 , 它 定 义 了 常量 INT МАХ. INT, MIN RI UINT MAX, 
它们 描述 了 有 符号 和 无 符号 整数 的 范围 。 对 于 “个 二 进 制 补 码 的 机 器 ， 数 据 类 者 im 有 ww 位， 这些 
ЕНДІМ ТМах,. ТМіп, 和 UMax, - 
ӨН. НИШАН 
有 有 特 号 数 另外 还 有 商科 标准 的 表示 方法 ， 
二 进 制 反 码 【Ones' Compiement， 又 评 作 “一 的 补 码 " )， 这 和 二 进 制 补 码 是 一 致 的 ， 除 了 最 高 
有 效 位 的 权 是 -(2" уе ж-е, 
wd 
B20 (X) = -na0n!-Ds Ух 
EE 


符号 数值 (Sign-Magnitude )， ЖЛ XC ЖЕ, AES THS БЕД БЕЛОЕ. 


У 


іші) 

这 两 种 表示 方法 都 有 一 个 去 怪 的 属性 ， 那 就 是 对 于 数字 口 有 两 种 不 同 的 编码 方式 。 对 于 两 种 表 
WA. ЮО... ОРО, MEO 在 特 号 量 形式 中 表示 为 [10.-- 们 ， 而 在 二 进 制 反 码 中 表示 为 
[1..1], 蓝 热 这 者 生产 过 基于 二 进 制 反 辆 表示 的 机 器 , 但 是 见 平 所 有 的 现代 机 器 都 使 用 二 进 制 补 码 ， 
Adr M S15 3685639 2 A00 46$ 5 3v. 


B2S „(Ху 2 (-1)93 - 
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и. ВРАТА А t ti оа orte А 
Р. ЖШ ЕТК. 

Bhort int x = 12345; 

short int mx = -Xi 


Bhow bytes|(byte pointer) вх, sizeofíshort int]]: 


1 
2 
3 
4 
3 show bytes[(byte pointer) &mx, sizeof(short intl): 





图 10 12345 40-12345 的 二 进 制 补 权 表示 ， 以 及 53 191 HERSART 
Ша EA HB ЖЕ. 


Зада 1р ЕКЕН ЕН, 这 段 代码 的 输出 为 和 39 XI cf c7, 3890 x 的 十 闪 进 制 表 示 汶 0x3039, 
rft] mx EF]-- 738 d e 9 О СРСТ. ЕНЕ 为 二 进 制 ,我 们 得 到 x 的 位 模式 为 [DO01IOO0OOIIIO01]， 
而 mx 的 位 模式 为 [1100111111000111]。 ШШ 2110Ж. 8:22 对 这 两 小 信 棋 式 生成 的 慎 为 12 345 
1-12 345. 





cmt scu Ue P RES ta бола km qoi WW qO 
Ей 3%%, Каса лана. СА Ж Ж НЕГА R Ж. titik 
ӛзін ASCI AE K E, EX 54 #-+ = ЕЗ 典型 地 者 是 用 二 进 制 补 玛 可 去 
RATHER. dd ni АЕ КЕИШ ЕПА ESL (ыы, ЄЛ REL 2-Яж 
3-05 d 35 


46 $2* 


在 下 面 的 列表 中 ， 对 于 标号 为 入 ~ 民 (标记 在 右边 ) SEES. f E (sub. push. mov 和 
add) 右边 显示 的 十 六 进 制 值 转换 为 它们 的 十 进 制 等 价 慎 。 


8348367; Bl ec 84 01 00 00 sub 50хі84,Жевр А. 
BI483bd; 53 push жерх 

8Ј4азре: 8b 55 08 оу ОйхВ{Җебр),%ойх В. 
8)483cl: Bb 5d 0с mov Охс{жерр), %ерх С. 
82483с4: 8b 4d ІП пау ÜxlJ(&ebp),*ecx D. 
8J483c7; Bh 85 94 fe ff ff тоу Oxfffffe94(t*tebp),teax Ë. 
82483са: 01 cb add $ecx,tebx 

80483сҒ. 03 42 10 add 0х10{%ейх),%еах F. 
948342: 89 85 ай fe ff ff mov $eax,Ü0xfffffeaD(Sebp) G. 
82482428: Bb 85 10 ff ff ff тоу OxfffffflO(&eopl,t*eax H. 
802483д4е: B9 42 lc mov *5eax,Ü0xlcí(t*edx) І. 
00485е1: 89 9d 7c ff rf ff mov $ebx,UüxIffirf7c(S$ebp) J. 
80483е7: Bh 42 18 mov Ox18(%edx),keax K. 


223 有 符号 数 和 无 符号 数 之 间 的 转换 

既然 820, АІ ВОТ, 都 是 双 射 它们 就 有 定义 明确 的 逆 映 射 。 将 U28, XL B2U, ,而 将 T2B, 
EXA BRT 。 这 些 耳 数 给 出 了 一 个 数 什 的 无 符号 或 者 一 进 制 补 码 的 位 模式 。 痊 定 0<x 2 
УВ х, ER C 028,(?) 会 给 出 x 的 惟一 的 w 位 元 符 号 表示 。 相 似 地 ， 当 x 满足 -2*!' ex 2", 
PS T2820) 会 给 出 x 的 惟一 的 w 位 进 制 补 码 表示 。 可 观察 到 ， 对 于 范围 0 < x 2" 内 的 值 ， 这 
两 个 函数 将 生成 同样 的 位 模式 一 一 最 高 位 是 0， 因 此 这 个 位 是 上 权 还 是 负 权 就 没有 关系 了 ，。 

考虑 函数 U2T,(x) = В2Т, (02В, w ， 其 输入 是 一 个 0—2"-1 LAA, ЖЗ 27-12911 
之 则 的 值 ， 这 里 其 个 数 有 相同 的 位 模式 ， 除 了 参数 是 无 罕 号 的 ， 而 结果 是 以 二 进 制 补 码 表 示 的 。 相 反 
Hi, ЖТД) (x) = B20U,,(T28B,(x)) 生 成 一 个 无 符号 数 ， 它 和 x 的 二 进 制 补 码 值 有 相同 的 位 表示 。 Ж 
如 ,如 图 2.10 所 汞 ,-12345 的 16 位 二 进 制 补 码 表示 就 和 53 191 的 16 位 无 符号 表示 相同 ,因此 ,T2Us(-12 
345) 253 191, ЖН UZT (53 191) = -12 345. 

XA HUS EXE ES HE HÀ. (8360 EET AERE КЕ S CX —— "E TES НЕЕ 
XT CUHUB PESCBUGTE S (82, За Ж fs E. ЖШ, ШШ T £r EBERT BS НТ 
TAE. 

1 int x = -1: 

2 unsigned ux = (unsigned) x: 

因为 从 图 2.9 中 我 们 可 以 看 到 -1 的 w 位 二 进 制 补 码 表 未 和 UMax 有 相同 的 位 表示 ,所 以 这 段 代 
码 将 把 ux 设置 为 VMax,， 其 中 w 是 数据 类 型 int 中 的 位 数 。 — Re. 从 … 个 有 符号 值 x 强制 类 型 
转换 到 无 符号 数值 unsigned) x RA AFERAN 72 口 。 强 制 类 型 转换 并 没有 改变 参数 的 位 表示 ， 
只 是 改变 了 如 和 何 将 这 些 位 解释 为 “个 数字 。 相 似 地 ， 从 无 符号 值 u 强制 类 型 转换 到 有 符号 人 (intyu 
怠 相 当 于 应 用 函数 027, 


ЖУН 2.18 
利用 你 解答 练习 题 2.16 RECS f$ Ж НҢ. HS T LAGE RUE Г, А 
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B2UASEBITAS) 2 2,-,(27 2 e x27. ЗЕ, ВШ Sa + ВОТ). 如果 
我 们 让 хе АТ), ӘПИЯ 
BIUQT2B, (x) = T2U, (3) = x, + x (23) 
ШЕРТЕР І BUM liz N 2 ПАЗЕТЕ x 的 二 进 制 补 码 表示 
P, rr ЙЕ Тара, ЯН 


| u 
DU, Ga) s Ші p (24) 
т, xz 


B 2.11 T RAN T2U ftp. WEERA. Ii HIT = AREE EHE 
t. EE REETXmEEN. mE REZHTS, 


age! 


йени o 





-5-1 


E21 АСЕАН ЕЕЕ 
ШЖ U ЖШН ИЕМ. 

















a ЕЕ mim UR үсү, =" ЖАНЫ. 27: 
Жанақ 24 bAa H jk k Ew 238 2.18 51 4 RS Ре ЯН, 


尽 过 来 者 ， 我 们 希望 推导 出 一 个 无 等 号 数 ERST RESTER ЕЙ Tio (иу. mg 
RINE те BWA ЯН 
BeT (U2B = UTA) = —z 7 + x (24) 
Ех Е, л ВЕТ х ЕА ЕР "<", НІН 
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X, көле! 
027,0) = (2,6) 
x-2", x22*! 
图 2.12 说 明 ХӘМ. ЧЕЛИ (270, P. Ki | 8 4FS IFE НЕН ЕН ЕҢ. 
对 于 大 的 数 《〈《>2” )， 数 字 将 被 转换 为 一 个 负数 值 ， 
2* т 


TU 
айақ sl % „г 





Ti | 0 #1 


pet 


图 2.12 从 无 符号 数 到 二 进 制 补 码 的 转换 
в ЕТА + -І 的 数字 转换 为 负 值 ， 


为 了 训 结 一 下 ， 我 们 可 以 考虑 无 符 叶 与 一 进 制 补 码 表示 之 加 互相 转换 的 结果 。 对 于 在 范 围 
gre 之 内 的 值 而 言 ， 我 们 得 到 TU, (= x 和 U2T, try =x。 也 就 是 说 ,在 这 个 范围 内 的 数字 
有 相同 的 无 符号 和 一 进 制 补 友 表 示 。 对 于 这 个 范围 以 外 的 数值 ， 转 换 和 需要 加 上 或 者 减 去 2". Я 
如 ， 我 们 有 T2U, (7-1) = -1 € 2" = Var 一 一 最 靠近 0 的 负数 映射 为 最 大 的 无 符号 数 。 在 男 一 个 
极端 , 我们 可 以 看 到 T2U, (ТМ) = 27-27 22" = ТМах„ + 1 一 一 最 小 的 负数 映射 为 一 个 刚好 
在 二 进 制 补 码 的 正 数 范围 之 外 的 光 符 号 数 .使 用 图 2.10 的 示例 ， 我 们 能 看 到 TZU st 12345)= 65 
563 +-12 345 = 53 191. 


224 C 中 的 有 符号 与 元 符号 数 

加 图 28 所 示 , 支持 所 有 整 型 数据 类 型 的 有 符号 和 无 符号 运算 。 尽管 C 标准 没有 指定 某 种 有 
符号 数 的 表示 ， 但 是 妃 平 所 有 的 机 器 部 使 用 二进制 补 码 。 通 常 ， 大 多 数 数字 默认 都 是 有 符号 的 。 
例 邓 ， 当 声明 - 74 12345 或 者 0x1A2B 这 样 的 常量 时 ， 这 个 值 就 被 认为 是 有 符号 的 。 要 创建 一 个 
КАБ BL, АЛПА "UT WA "u^ Cyn. 1234517 或 者 Ox1A2Bu), 

С SHORE TEE ДЕНІНЕ. ИШ REGIS SCR ERRARE. БІЗ, (6 6r XE 
补 码 机 器 上 ， 当 从 万 符号 数 转换 为 有 符号 数 时 ， 效 果 就 是 应 用 函数 СОТ, ЛАН ЕЕ В 
КЕ СНТ, MEHANA TU, KT w 表示 数据 类 型 的 位 数 ， 

显 式 的 强制 类 卉 转换 将 导致 转换 的 发 由 ， 就 像 下 面 的 代码 ; 








1 int tx, ty; 

4 WUnsigned ux, цу; 

3 

4 tx = iint) ux; 

5 uy - (unsigred) ty; 


55. Е-Е ДАЛ NUBE EB ANT OSEE EM. yj E S V Eb, XIRT IE 
ВУРСА; 


l int Ех, ty; 
2 unsigned ux, uy; 
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ux; /* Castto signed */ 
ty; /* Cast to unsigned */ 
МН printf ОАЕ, 9л а. Фи ЖФх 分 别 用 来 以 有 符号 十 进 制 、 无 符号 十 进 制 和 
| 六 进 制 格式 来 输出 个 数 子 。 注意 printf 浅 有 合用 任何 类 型 信息 ， 所 以 它 可 以 用 指示 符 和 你 0 来 输 
HRA int 的 数值 ， 也 可 以 用 指 小 符 %d 输出 美 型 unsigned ИА. РИШ, AE F fees. 
] int x = -i: 
unsigned u = 2147483548; /* 2 to the 3la- */ 


2 
E 
4 printfi"x 
5 nprintfi"u 


$u FANO", x, XH: 
%1: Жалп", u, ub; 

"ME - 32 УВЕ КЕТ, smua F; 

x = 4294957295 = -1 

u = 2147433648 = о-л1А474Н16Ь48 

МІН, рї Ë 38 X T TÍEAR— TAS Wah, AEREE E TI 5 5 SGN 
出 。 我 们 可 以 看 看 实际 运行 中 的 转换 函数 ; T2US(C 1) = ИМаху= 4 294 967 295 $ü U2T,,2 = 27! — 
2? = — 2° = TMins. 

由 于 C 对 同时 包含 有 符号 和 无 符号 数 的 表达 式 的 处 理 方式 ， 出 现 了 一 些 奇特 的 行为 。 当 执行 
个 运算 时 ， 如 果 它 的 一 个 运算 数 是 有 村 号 的 而 另 一 个 是 无 符号 的 ， 弄 么 C 会 隐 含 地 将 有 符 和 写 参 
煞 强 制 类 型 转换 为 匹 符 号 数 ， 并 假设 这 册 个 数 都 是非 负 的 ， 来 执行 这 个 运算 。 训 像 我 们 会 看 到 内 ， 
庆 种 方法 对 于 标准 的 算术 运算 米 说 并 无 多 大 差异 ， 们 是 对 于 像 < 和 > 这 样 的 关系 运算 符 来 说 ， 它 会 
РИ ВАНА Ж. 图 2.13 展示 了 ЕХ ЛАЗИТИ ЈАКНА Ж, AE 
假设 使 用 的 是 S 32 位 机 器 和 二 进 制 补 码 表 坟 。 与 直觉 人 不 相符 的 情况 用 “*” 标 出 来 了。 考虑 一 
比较 式 -1<0U。 因 为 第 二 个 运算 数 是 无 符号 前， 所 以 第 一 个 运算 数 就 会 隐 含 地 转换 为 无 和 罕 号 数 ， 
ИШЕК a 9 ET 4294967295U«0U (回想 -下 T2U C-l) = UMax,)， 这 个 答案 显然 是 错 的 。 男 
外 邦 些 示例 了 思 可 以 通过 相似 的 分 析 来 直 钥 。 


-i « 00 
214748354! > -2141483547 ` 
Jlà74Bi6470 . -2147483647-1 


22474483547 > iint! 21471836487; 
-1 > -Ë 


unsigned; -l > 2 





图 2.13 ЗЕ Е САН (promotion rule) 的 效果 
iE Wired eGil Ut". SERRAR RATE SERBIEN ИЧ, 1-а К ЕЮ да НН ЕЕ. E 
Ci, ME eB IR BE. EEE ІМіп 32 753 -2147483647-1, -2147486 Ж ЕНЕ - 4E NI -X ІНІНЕН 
ВЛЕ Ал АХ. KH. {1 21473836418 本 大 了 ， 不 能 表示 为 1324. САН ШК. 
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REER Аа Ёё) 32 位 机 器 上 对 该 些 表达 式 求 值 ， RRE 2.13 的 风格 ,填写 下 表 ， 
描述 强制 类 型 转换 和 关系 运算 的 结果 ，; 


-2147483648 == 21474836441) 


-2147483648 < -21474836437 mE 


(unsigned) -2147482648 < -21474816487 
-214748364B < 214748356487 


(unsigned) -2.4748364BR < 21474835487 





22.5 扩展 一 个 数字 的 位 表示 

一 个 常见 的 运算 是 在 不 同 字 长 的 整数 之 间 转 换 ， 同 时 又 保持 数值 不 变 。 当 然 ， 当 日 标 数 据 类 
型 太 小 了 ， 以 至 于 不 能 表示 想 要 的 值 时 ， 这 可 能 根本 就 是 不 可 能 的 。 然 而 ， 从 一 个 较 小 的 数据 类 
型 转换 到 -个 较 大 的 类 型 ， 应 该 总 是 可 能 的 。 要 将 一 个 无 符号 数 转 换 为 -个 更 大 的 数据 类 型 ， 我 
信 只 要 篇 单 地 在 表示 的 开头 添加 0。 这 种 运算 被 称 为 零 扩 办 (zero extension)。 要 将 一 个 一 进 制 补 
玛 数 字 转 换 为 ~ 个 更 大 的 数据 类 型 ， 规 则 是 执行 一 个 符号 扩展 sign extensiony， 在 表示 中 添加 最 
高 有 效 位 的 信 。 因 此 ,如 果 我 们 原始 值 的 位 表示 为 Ex,_1 a xe ,那么 扩展 后 的 表示 就 为 [各 
Wl Хы» Жу; 718 Aple 


例如 ， 考 虑 下 面 的 代码 | 


short sx - val; i$ - 12345 */ 
unsigned short usx - ах; ж 5319] */ 
int x = sx; [+ -12345 */ 
unsigned ux - usx; i* 5319] */ 


printfí("sx = &d:At", sx); 

show bytes((byLe pointer) &sx, sizeofíshort]); 
printfi"usx = $u:\t", usx'; 

9 show byLes((byte pointer) &usx, sizeof {unsigned short): 
19 printfí("x = d:e", x); 

11 show bytesí(ibyte pointer) Ех, sizeofí(int]); 

12 printf ("ux = $&u:Xt*, ux); 

13 show bytesí(ibyte pointer) &ux, sizeof(unsigned)); 


ТИШН ЖЕЧИ ЕК) 32 位 大 端 法 机 器 上 运行 这 段 代码 时 ， 将 会 打印 出 如 下 输出 ; 


бс Л cn їл на QJ B p 


SX = -12345: cf c? 
usx = 53191: cf с? 
x = -12345: ЁЁ ff cf с? 
ux = 53191: 00 0D cf с? 
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我 们 看 到 ， 尽 管 -12 345 的 二 进 制 补 玛 表示 和 53 191 的 无 符号 表示 在 16 位 字 长 时 是 相同 的 ， 
但 是 在 32 位 字 长 时 却 是 不 司 的 。 特 别 地 ，-12 345 的 二 六 进 制 表示 为 OxFFEFFCFC7, ІП 53 191 的 
十 六 进 制 表示 为 0x0000CFC7， 前 者 使 用 的 是 符号 扩展 一 一 16 个 最 高 有 效 位 1， 表 水 为 十 六 进 制 就 
是 0xFFFF， 被 吉 作 于 头 的 位 。 后 者 使 用 16 个 0 来 扩展 ， 表 示 为 十 六 进 制 就 是 0x0000。 

我 们 如 何 证 故 符 号 扩展 工作 得 正确 昵 ?我们 想 要 让 明 的 是 ВОТ, Las 77», Xuan С”, 
x) = ВТ, xXw 2 加， 这 时， 在 左手 过 的 表达 式 中 ， 我 们 增加 了 六 个 位 x 的 副本 。 
证 明 是 对 大 进行 归纳 。 也 就 是 说 ， 如 果 我 们 能 够 证 明 符 号 扩 最 一 位 保持 了 数值 不 变 ， 那 么 符号 扩展 
任意 位 都 能 保持 这 种 局 性。 因此 ， 证 时 的 任务 就 变 为 了 ， 


B2T, лә tr Х-и Жул; Амер, IU х) 一 В2ТЫЦХ,„-\› 4-2 Us хо}) 


用 等 式 2.2 ЕЛА ЯЛЕ АКА. 28 3; 





w-I 
B2T (2-р X2» рэ Xal) = EXPE 
dl 


w- 
— — w Wel I 
іші) 


w 
-x, 40" -27 4 У x2 
іа) 


w ‚ 
EE 90-1 Г 
= —Х„_|2 +) х2 

і-0 


= Bx. халы а) 

我 们 使 用 的 关键 属性 是 -2 «27! 2-277. 因此 , HL E — F AUB JD 2" 的 位 和 将 ARA- 
的 位 转换 为 一 个 权 值 为 2 的 位 ， 两 项 运算 的 综合 效果 就 会 保持 原始 的 数值 。 

值得 一 提 的 是 ， 从 一 个 数据 大 小 到 另 一 个 数据 大小 ， 以 及 无 符号 和 有 符号 数字 之 间 的 转换 的 
相对 顺序 能 够 影 啊 一 个 程序 的 行为 。 考 虑 我 们 前 面 那 个 例子 的 如 下 额外 代码 ， 


unsigned uy = x; /* Mystery! */ 


上 

2 

3 ртіп ("у = ЖА", uy); 

4 show Dytes((byte pointer) kuy, Sizeof(unsigned)); 
这 部 分 代码 产生 如 下 输出 ; 

uy = 429495495]; ff ff cf c? 


这 表明 表达 式 : 

(unslgned) (int) sx {* 420495495] */ 
和 

(unsigned) (unsigned short) sx J* 53191 */ 


产生 了 不 同 的 数值 ， 即 使 原始 的 和 最 后 的 数据 类 型 是 相同 的 。 在 前 一 个 表达 式 中 ， 我 们 首先 将 16 
位 的 short 符号 扩展 为 32 位 的 int， 而 在 后 一 个 表达 式 中 执行 的 则 是 零 扩 展 。 
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者 虑 下 面 的 C Ж. 

int funi(unsigred word) 
{ 


return (int) ¿(word << 24) >> 24); 


} 
int fun2íunsigned мога) 
1 
return (í(int) word << 24) >» 24; 
) 
假设 在 一 个 使 用 二 进 制 补 码 运算 的 32. КНЕ КАНЕ ИНИ AES AULA ЕВ 
及 算术 在 移 ， 而 无 符号 教 值 的 志 移 是 还 辑 右 移 ， 
А. HETA, HARE RA LATERA. 


= |. — 
— 
— 

nm 






B. HORE ЖАЙЫК ШЕ АЖАТЫ mei X, 


2.2.6 ЖҚС 

БАН КЕН ЖА Е HR. RU WU R CEDE. ӨНЕ ilt enin 
头发 生 了 这 种 情况 ， 

l int x - 53131; 

2 Short sx = (short) x; Р“ -12345 */ 

3 int y = SX; /* -12345 */ 


侍 一 全 典型 的 32 位 机 器 上 ， 当 我 们 把 x 强制 类 型 转换 为 short 时 ， 我 们 就 将 32 位 的 int BS 
为 了 16 位 的 short int。 就 像 我 们 前 面 所 看 到 的 ， 这 个 16 位 的 模式 就 是 -12 345 的 二 进 制 补 码 表 杰 。 
当 我 们 把 它 强制 类 型 转换 思 int 时 ,符号 扩展 把 高 16 位 设置 为 1， 从 而 生成 -12 345 0832 位 一 进 制 
补 玛 表示 。 

当 将 :一 个 w 位 的 数 [Х,а xs HABT y M k DECEM, ЖЕТЕН wu, 84) 
18 uas ль». л]. ARI CE TE КЕ I ER E M FUE. 我们 现在 来 
研究 -上 什么 数值 将 产生 这 种 情况 。 对 于 一 个 碟 符 号 数字 x+， 截断 它 到 位 的 结果 就 相当 于 计算 x 
mod 2 。 通 过 点 用 模 运算 到 等 式 2,1 就 可 以 看 到 





| шы, 53 
I " :i 


W 


| 


B2U ll рр) miad M | «Pme м 





0 
Ta 
Ee mod 2“ 
pz 

k 


Ух y 
і- 
= BAU ([x nis ong D 


ИШЕН, ЯПАН ТЩН. ЧЕН DK 7mod?z04py, 2259, 2-2-1«2, 


МТС. ЖШШЕ REI] BT, (г. usns n D mod 2* = ЕО, nass 
xg ЕҢ, x mod ЕН- Ter ER p rn, xy] ARES NEG. Ан. ШШЕ. 我 们 
将 截断 的 数字 视 为 有 符号 的 。 这 将 得 到 数值 UT ir mod 25. 

总 而 言 之 ， 截 断 的 周 果 如 下 所 示 ; 
ЕЛ Га Xx, xg] = B2U, (Lr, x. I, xal) mod 2 (2) 
B2T, (5, 1.1.77, жі = ІЛТ, (ЕТ, (bru, хау, xD mod 25 (24) 
练习 是 222 | 


RRAN- Peri ki CR cible 0--F 表示 ) MORE Qk CRF AGB AUR 


FOTRE) ШЕТА, HAUTEUR с Ил E. Hog cR ec He 
HRE, 





227 去 于 有 符号 数 与 无 符号 数 的 建议 

束 兴 我 们 看 到 的 那样 ， 有 符号 数 到 无 符号 数 的 原 式 强制 类 型 转换 导致 了 某 些 与 直觉 不 相符 的 
行 久 而 这 些 与 直觉 在 机 将 的 特性 经 常 导 臻 程序 情 误 ， 间 且 忆 洁 陷 式 强 制 类 型 转换 的 组 微 差别 的 
错误 很 难 锌 发 现 。 因 为 这 村 强制 类 型 转换 是 看 不 到 的 ， 忽 们 经 党 息 视 了 它 的 影响 ， 


518223 ib id т 
ЖАТҚАН, алин AOL a ФИА Ы, РАЛЕ AME Uk eng led 
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1 P WARNING: This is buggy code */ 

? float sum elements[fioat af], unsigned length) 
3 [ 

4 іпЕ 1; 

5 float result = 9; 

Б 

T 


for (i = Ü; i <= length-1; i++} 

8 result += ali]; 

9 return result; 

10 } 

当 运 行 时 参数 lengh 等 于 零 ， 这 段 代 码 应 该 返回 0.0。 eX FRE, ҚАЗАН 448% ( memory ) 
错误 ， 请 解释 为 什么 会 发 生 这 样 的 情况 ， 并 且说 明 该 如 何 修改 代 矶 ， 

避免 这 类 错误 的 一 种 方法 就 是 绝 不 使 用 光 符 号 数 。 实 际 上 ， 除 了 C 以 外 很 少 有 语言 支持 无 符 
号 整数 。 很 了 明显， 这些 其 他 语言 的 设计 者 认为 它们 的 麻烦 要 比 益处 多 得 多 。 比 如 ，Java 只 支持 有 
符号 整数 ， 并 是 要 求 以 二 进 制 补 码 运 算 来 实现 。 正 常 的 右 称 运算 符 >> 被 定义 为 执行 算术 右 称 。 特 
殊 的 运算 符 >>> 被 指定 为 执行 逆 辑 石 移 ，。 

当 我 们 想 要 把 学 仅仅 看 做 是 位 的 集合 而 没有 任何 数字 意义 时 ， 无 符号 数值 是 非常 有 用 的 。 例 
W, E -个 字 中 放 入 描述 各 种 布尔 条 件 的 标记 ( flag ) 时 ， 就 是 这 样 。 地 址 自然 是 无 符号 的 ， 所 以 
系统 程序 员 发 现 无 符号 类 型 是 很 有 帮助 的 。 当 实现 模 运 算 和 多 精度 运算 的 玫 学 包 叶 ， 数 字 是 由 子 
的 数组 来 吉水 的 ， 无 符号 值 也 会 非常 有 用 。 


23 整数 运算 
许多 刚 入 门 的 程序 员 旧 常 惊奇 地 发 现 ， 凑 个 正 数 相 加 会 得 出 一 个 负数 ， 而 所 比较 表达 式 x<y 


和 比较 表达 式 x-y<0 会 产生 不 同 的 结果。 这些 属性 是 计算 机 运算 的 有 限 性 造成 的 。 些 解 计算 机 运算 
的 细微 之 处 能 够 帮助 程序 员 编 号 更 相 靠 的 代码 。 


231 无 符号 加 法 

考虑 两 个 非 负 整数 x 和 y， 满 足 D<ty<e2-1。 每 个 数 都 能 表示 为 mg 位 无 符 呈 数字。 然而 ， 
如 果 我 们 计算 它们 的 和 , 我 们 就 有 一 个 可 能 的 范围 0<xr+7y<2 -2。 表示 这 个 和 可 能 需要 wel 位 ， 
例如 ， 图 2.14 Fo T 25 x Ly B Po. (ANC e y ШАН, 参数 《显示 在 水 平 负 上 ) RE 
范围 为 0~15， 但 是 和 的 取 值 范围 为 0~30。 函 数 的 形状 是 -… 个 有 坡度 的 平面 。 如 湿 我 们 保持 和 为 
—^ wel 位 的 数字 ， 并 用 把 它 如 上 另外 :个 数值 ， 我 们 可 能 需要 w+2 个 位 ， 以 此 羔 推 。 这 种 持 绕 
的 “ 字 长 膨胀 ”意味 着 ， 要 想 完 整地 表 泵 算术 运算 的 结果 ， 我 们 不 能 对 字 长 做 任何 限制 。 一 些 山 
Ғана, ИШ Lisp， 实 际 上 就 支持 无 限 精 度 的 运算 ， 多 许 任意 的 《当然 ， 划 在 机 器 的 企 储 器 限制 
ZA) 恭 数 运算 。 更 常见 的 是 ， 编 程 诺言 支持 固定 精度 的 运算 ， 因 此 像 “如 法 ”和 “乘法 ”这 样 
的 运算 不 同 于 它们 在 整数 上 的 相应 运算 。 

无 符号 运算 可 以 被 视 为 一 种 形式 的 模 运 算 。 无 符号 加 法 等 价 于 计算 模 NR. nj DEI S 
HUE х+у 的 wel 位 表示 的 高 衬 ， 来 计算 这 个 数值 。 比 如 ， 考 虚 一 个 由 位 数字 表 沙 ，x=9 和 y=12 
的 位 表示 分 别 为 {1001] 和 [1100]; 它们 的 和 是 21, 五 位 的 表示 为 [101011; ІНЕ ЕТЕУ, 


信息 的 表示 和 处 理 55 


RIRA], ЖЕЙ. БИЕ S. ЙЕЛ mod 16 m5 一至， 
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Е215 整数 加 法 和 无 符号 加 法 间 的 美 系 

i Bj. ШИШ HL 

ІШ, НЫН, Wa reyc2", 和 的 wel dk п ғо, BEES 
EAS ER ӘЙ. H-H 如果 exeye2'7, ИН 位 表示 中 的 最 高 位 参 等 于 1， 因 
ЯЕ pA Rak A T 2" 图 2.15 说 明了 这 两 种 情况 。 这 安 得 到 一 个 范围 0&1 +у-2"< 
2 -Fay 中 的 值 ,刚好 等 于 xz 5s vifi. pm THES. RUKA SE: «o, 
АН П<л,у<27, ШЕ, 

X у, х+у<2" 


| 
ХЕ үш | i 
y+y=2",  2'"s3g4y«2*! ы 


36 # 1 


КЕ E E C АГ (0E FEE nir] RTB ЭШЕЙ. 

ИИ И Г, Rikunki p a hk НЕЕ sty ЕЮШШ. Ші 2.9 
Bras, ТУА ИСТ 2 m KH. АЕ ГН. M20168 T ZK а СЕРЕН 
W MEB. ARER 2-16 计算 的 。 当 кту EP. ҰШЫ, ЗЕН eet y Елеу, 这 对 
MF PIO "ЕН" NE. Эх+у> 16 时 ， 吉 法 洲 出 ， 蛙 果 相 当 于 从 和 中 减 去 86。 这 对 应 
Fl ino "Bib" sti. 

当 执行 C РИНЕН, АННЕ НЕ MR X. ЖИЕНИ. ЖИПЕК HEP R ЕЕ 
't T. ш. БЕЯ тех у, GEH RUM EONGE RESET зу. ЖЫП R g 5 
sx (ЕН теу) PF, ЖЕТЕН. EFRO. ШЕШ vers Bitit satri. 
REPNE ex. ГО, Е АЗ T. RITE sy. REY er. RITE 
у<Г<іһ Bi szrev-2" ex. ФРГ, ЖЕГІН Н9212-5. HA S<9， 我 们 就 
ПЕНЕТА. 


Еш (uie ko 


т 1 š А Ey d Р | 
“К ; | = ш | = : 
p. | Ld y." tr а 
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215 无 符 导 加 法 


ШННЕСЕЕ. ЖӘН L6 n. 


БЕЛЕ Т СА КО, BNF АЕ ( Abelian group), X El PF ЁШ Niel Henrik 
Abel (1802— 1829) Brem. BEP. v Rajai ОЗШЕН ДАШ “Abelian” 的 地 方 ) 
Warte. fino. TEHSET KE — Tini. ІНІ ИНЕҢ i. 位 
HER Ema. Turnip... CERERI X. HEX t-i r3 x-5 re хай. 当 


tt hd Жз 37 





Ts 由 时， 加 靶 道 元 显然 是 总， 对 于 二 > 由 484 27 - x, RAINER TC -rey ШШ 
ZH. Вх + 27) mod 2" = 7 mod? =0。 因 此 ， 它 就 是 x 在 4 下 的 道 元 ， 这 两 种 情况 就 导出 
THF 0С тесе, 


X, x ztü 


Nam (2.10) 
2% - х, rl) 


fni S РАТ А В E кч uka. АРРА iki, EX 
21033 TEK, ЕГЕН ERU CEA T UT S i EAT. 





232 ”二进制 朴 码 加 法 

QT 3p m dH. SP қу 2 PETER z 和 y Е 
TERREA- адну 2-228. TERE wel Eden. Hei. ӘПИЯ 
截断 到 із. NONAS Cp. Mul. B MENGE LETERE mka, 

两 个 数 的 w {у ЫҚЫ RUSSE RE Ze RR Se IRI RR e. К. КЕЛІНІ 
ЛЕТЕТИ FR S RI ТЕРӘК. 因此 , RT E 2 KO "сна. 
在 三 算数 x 和 yy 上 表示 为 的 + WET En z27. 

z+, у š UT U (x) + Т) (yy) (2.11) 
ЖИ 23, ПП T2U G8 х„2*+х. 把 ТОШУН у, +y. 使 用 属性 ， Ha. 
EEI Hmi. ШАШ ШЕЕ. ЖП И, 
r+, у = ШОТ, (T2U, (0) ТЭ! (ур) 
= U2T,[(-1,.42" x7 y, 42" + y) mod 2"] 
= U2T,[(x-- y) mod 2" | 

WB: T хы 和 к. ый. 因为 它们 模 2 等 于 0, 

MT REN HOME TW, ЗЕЕ 2%: MER х+у, rJ yay mod 27. W Z X 
с" = ОТ, (21. ШШ г T ral у. ТНТ РЕ НЦ, ШШ217 E 

l.-2"£:«-2"', п. {ЖН Z= 227. ШН OS e 277422277, 检查 等 式 2.5， F 


58 | „Ё$.; 


们 看 到 GE =Z HANZA. 1АЙ НЕШЕ А A AE (negative overflow). LEE RIETI І 
A у 相 加 【这 是 我 们 能 得 到 < - if 770), 8I HEREDES" mre уко", 

2-2" s:«0. ЖА. ЮПИ anr, 8 3B| 2 r-r Z 42". 检查 等 式 6， 我 们 看 
到 = 在 满足 z mg -F REN. AE =r- е 17-07 г. ШЕП, 我 们 的 二 进 制 补 码 和 
STER xy. 

105:«2". ЖА. RS Z=. оге 2", гагат, Ж ШИН" УЖ 
PERH x + y, 

4.2 2:22". ЖА, ПУН гат, НЫН ңғ BEI FEP. RIT = т. 
得 到 = т + 六 ТХИ А Ш (positive overflow). AREN ЖУН СЕ ETTI 
能 得 到 zz 2 Е), BITTER "= v2". 


K + y 


“Таш 





217 整数 和 二 进 制 补 码 加 法 之 间 的 关系 
4xey &T-77 M, Pb hiki. SET Tun M. ЕЕН. 


ін. RATUR SAEN- 5x, уз” !-1 2 AS c y EGRE +. М, 
STR PEREAT: 
rey-2", 2—1 5х+у iE d Hi 
ety = riy, -2"'&х+у<2”! 正常 (212) 
rty£2", pay €-2"! тінін 


EARN. 图 2.18 NOn D Ps e Ind. BT DH LIE E ER 
PEA 2.12 的 推导 过 程 中 的 情况 。 注 意 Y= 16. ЫҢ ЛШ B EU ЧЕ ШЕЮ Ж; 16. dE dS 
AARRE 16. ПЕН ПЕНКЕН ЖЕНУ OD. Ra uN 3]. [КЕЧПЕ 
КИТСЕН ЕНЕ ра ДА SUIS. МИЕ. 

m219Nib J FE w =4 Bi НЫН. ЕЙГШ Л-В-—7 2 |8. "xeve-BH. 
НАНЫН, 导致 和 增加 了 16. IHRE ey cB BI, ШИЙ IE r+ y. re y78. 
ini ЕНЕН, (AHD T 06. ЕНІНІҢ MEE T BEIM ЕНЕ. 
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FA 2.12 BERTA HI ТШЕН FAEERE. Ry Ж . (UE. yz0 时 ， 我 
ПЕН. Эх у ЕЕ. ЕДІ у<0М, БІЛЕГІН. 













[0101] 





[0101] |0111 
š 4 10 7 
[0801] |0101) 










| | [1010] 
Е2ІВ 二进制 补 码 加 法 示例 
"ААТ ЕН РЕ НЕЧ, Және ИНДЕ ЕШ ЖЕЛ. 


menn (Br К 










il 






ES 
Lu 
LIN 







& ы! š 
аталы “А, 
VE 








Ë a ы ы 
= Жыла ЕСІЛ 
EN ш 
- m. 
= z 
м 
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T ОПТИ T. Srevc-RH. Ші BH. Mirer, фоат. 


ЯН 2.25 


ЖИЮ 2.18 VERUS EE, Оф, Ee aded. 
DRAIG НД фт, CLIE FA 2:12 推导 的 情况 ， 
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(x Уу ә | m Dj 
ке шш р ү 
Dm таң | | E 
[um эт БЕНЕН ЕНЕҢ БИІ 
ше жш И А 
[mm mm | ү | 


23.3 ”二进制 补 码 的 非 

SAT ELE Sd E-2" < x c2" 中 的 每 个 数字 X МЕН +, 下 的 加 法 道 元 : 首先 , SEP x 2". 
我 们 可 以 看 到 它 的 加 法 道 元 就 是 -x。 也 就 是 ， 我 们 有 -2 < x< 25 x4, x-ox4xc0, 18—77 
E. WF x=-2" = ТМ, -x= 不 能 被 表示 为 一 个 w 位 的 数 。 我 们 声 时 ， 这 个 特殊 值 本 身 就 是 
BE, RIAM. -2"!41-2"' 的 值 由 等 式 212 的 第 三 种 情况 给 出 ， 因 为 -2 2 1-2", 
这 得 到 -2” + -2”= 2*4 2"- 0。 从 这 个 分 析 中 ， 我 们 可 以 定义 对 于 范围 -2 <х<2” HF х, 
一 进 制 补 码 的 站 运算 (negation operation? ШК: 


-1 一 | 
! -QUO, x=-2" 
— X, х>—2" 
















(2.13) 


练习 是 226 


我 们 可 以 用 一 个 十 六 进 制 数字 来 表示 长 度 w=4 的 位 模式 。 对 于 这 些 数字 的 二 进 制 补 码 的 解释 ， 
AEFT., METAF kA, 





对 于 二 进 制 补 码 和 无 符号 (894224) АЕ (negation ) 产生 的 位 模式 ， 必 观察 到 什么 ? 


一 种 有 名 的 用 来 执行 性 级 二 进 制 补 码 的 非 《negation) 的 技术 是 ， 对 每 个 位 取 反 【或 取 补 )， 然 
РЕЖ. С, 这 可 以 写成 xX+1。 АТЫНАН АҚЫННАН, ЫЛ, 对 丁 每 个 位 x,， 
RIA x= I- x. RIE -TERA w 的 位 向 量 ，x= В2Т„(х) 是 它 表 未 的 - 进 制 补 说 数 。 根 据 等 
式 22， 取 友 了 的 位 向 量 -有 如 下 数值 : 


入 息 的 表示 和 处 理 6] 


w- 
B2T,C 3) -0-,ау + Yao? 


ї=0 
н-2 w-2 
- - 2” 4 агт + уа? 
і-0 1=0 
= [-2" +2" 1-1]- ВӘТ, (Я) 
= -1-x 
上 述 推导 中 ， 关 键 的 简化 是 ”2 =2”" 1。 内 要 将 "加 1， 我 们 就 能 得 到 -x Т. 


ЖОНУ N xm [nua қас ХІ. 将 运算 incr 定义 为 : 设 大 为 最 右边 的 D 的 位 置 ， 
这 样 : 就 具有 这 样 的 形式 [x „л, xus 1 П 然后 ,我 们 将 ane X Das о ы, 1, 
0,7, 0]。 对 于 x 的 位 级 表示 为 [1, 1,…, 1] 的 特殊 情况 ， 将 iner( Ху 20,5, 01。 为 了 说 明 iner( x ) 
(Sm E x+. 1 的 位 级 表 未 ， 考 虚 下 面 的 情况 ; 

l. Mg = [Lun UM. RNA х= 1. 被 增加 的 值 incr(H[0，…，0] 有 数值 0。 

2. M k=w-1 1, В р [0, 1,…, 0, RDH х= ТМах„„ 被 增加 的 从 iner) -|1,0,4,00Н ЖҮН 
ТМіп,. А 2.12， 我 们 可 以 看 到 TMar, t 1 是 正 溢出 的 情况 之 -， 得 到 TMin,. 

3. "5k« w-L B, ERE х e Мах, П.х 1 时 ， 我 们 可 以 看 出 incra ЙЕ К+ 1 5 ЖИН 2, 


k- 
fix ME Е +1 AUREA У 2 =2 1, РИНО В w-k+ Y 位 有 相同 的 数值 。 因 此 ，incr{( 习 有 数值 
i=} 


xl. ЖК. AF x= TMax,, Xpx Dn еен, Aert EFF xl. 
开盘 说明 的 那样 ， 图 2.20 л EE ОЦ} ЖІ ЕЙІН EUG L VU ЛЕ ЕНІН BEER E o 


[0101] [1010] - [1011] 
[0111] [1000] - [10011 


[1100] - [0011] [0100] 
10006] [1111] ` [0000] 
[1000] - [0111] [10001 





5220 HR (JRI 和 增加 四 位 数字 的 示例 

效果 就 是 计算 一 的 值 的 非 。 
234 无 符号 乘法 

A BIO € x, y 2-1 内 的 整数 x 和 yn 以 被 表示 为 w 位 的 无 符号 数字 ， 但 是 它们 的 乘积 x y 的 
RUE iS BE 0—(2"-1y = 29-294 之 间 。 这 可 能 需要 2w 位 来 表示 。 不 过 ，C 中 的 无 符号 乘法 被 定 
AAE w МЕКЕН ЕНЕ w 位 表示 的 值 。 根 据 等 式 2.7， 我 们 可 以 看 出 这 等 价 于 计算 模 2* 的 
ЖД. EE, w 位 无 符号 乘法 运算 所 的 效果 为 

хі у= (x. y) mod 2" (2.14) 
大家 都 知道 模 运 算 形 成 了 环 ,因此 我 们 可 以 推出 w 位 数字 上 的 无 符号 运算 形成 了 环 ({0,.…,2*-1)， 
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нж 0, 1). 


2.3.5 二进制 补 码 乘法 

WE- «x ys27 -199] x du y 可 以 外表 示 为 mw 位 的 一 进 制 补 码 数字 ， 但 是 它们 的 乘 
积 x.y 的 取 值 范围 为 -2” C2" 1-1) 2-27 74271 2 -ala 2 之 问 。 要 想 用 二 进 制 补 玛 来 
ЖАС УН, 可 能 需要 2w 位 一 一 大 多 数 情况 下 只 需要 2w-1 位 , 但 是 特殊 情况 277^ ER 2w 位 ( 包 
括 一 个 符号 位 0)。 然 而 , C 中 的 有 符号 乘法 是 通过 将 29 位 的 乘积 截断 为 w KERK., REFN 
2.8， 风 位 的 二 进 制 补 码 乘法 运算 є 的 效果 为 


t 


x tu у= U2T,(x - y) mod 2") (2.15) 


SL A NOS ma B rh Ki, За А Ну ЕКЫ ЖЕН. WA. Sx 
ЕЁ w mp rmn Eb xd y. LEH We мп, 820,00 [f] fir 2E XE on ы — Bl НЩ ER 
BT, Go, B2T ӘРИ ЖУАН [8]. XE BH BL aT DLE ЕН ЭНА НЕ KATE ТЕ 
x. 

为 了 看 清 这 一 点 ， 设 x = B27 (х) R у = B27 (y) EEG Et a nh ВЕНАМИ. wl 
x - B2U ДЖ y s В2 , (9) EUR АН TPS BC. 根据 等 式 2.3, RU x - x+ x, 2" 
Wy -узу,42”. ИННА 2" 乘积 得 到 以 下 结果 ; 

(7Jmod2” = {{х+х„_ 2°}. (y 2 mod 2" 
= [e yA ружу 02 + x, ay, 2" ]mod 2" 
= (x:y)mod2" 
因此 ,x .y 和 x .yy 的 低 w 位 是 相 己 的 。 
正如 襄 明 的 那样 ， 图 2.21 展示 了 不 同 的 三 他 数 字 乘 法 的 结果 。 对 于 每 对 位 级 运算 数 ， 我 们 婚 执 


ПЯНА, ӘЛІН МӘЖ. 注意， 无 符 只 已 截断 乘积 总 是 等 于 xy тоб 8, НИТО 
ЯНА ЕНА, 


(2.16) 


| ой ху | 


— [101] OLLI [001111] [ 
САНЫН [101] [011] [110111] 
[100] 


111] 
[111] 

EHS 111] [031100] [100] 
ЖИНА - [100] -1 [ИП [000100] [100] 


ATE 3 [0113 1 [011] 9 [001001] | [001] 
二 进 制 补 码 3 [011] 3 [011] 9 1001001] l [001] 
图 2.21 = EB A HO 3 ЖӘ 
ОВ GERE i ETT BE RR. IER ЖЕЕ К GER Жл Roig. 
510 227 
填写 下 表 ， 说 明 不 同 的 三 位 数字 来 法 的 结果 ， 按 照 图 2.21 的 风格 : 
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[3140] 
(010) 


nii 
[111] 





我 们 可 以 看 出 ，w HARTERA SERM МА SEE IHURU)T Sie S. -,. €, 和 
+ cy * 有 相隔 的 位 级 效果 .。 据 此 , 我 们 可 以 惟 断 出 一 进 制 补 四 运算 形成 了 环 (727, 2-1), 


t t і ` 
Hars р уро 9. l;e 


236 ЖИ2 Ж 

EKZIS L ARARA НИЕ, mE 12 ЖЕ КЕНІ, ЖІП UGM ОА 
#——БИШШУЛ. wk. ИЕН — E 1 个 时 钟 周期 。 因 此 ， 编 译 器 使 用 的 一 项 重要 
的 优化 万 是 武大 用 称 位 和 加 法 运算 的 组 全 来 代替 乘 以 常数 因子 的 乘法 ， 

设 x 为 位 模式 [x as хь. xs GRECE S TER. ДРА, SETA EO. ҒА 好 的 位 级 
AR ER Хр, 0,…,0] 给 出 的 ， 这 里 右边 增加 了 上 个 0. 这 个 属性 可 以 通过 等 式 2.1 推导 出 
来 : 


н” 1 
ВШ» p e з ag 00D. = ўуд2 
І-і) 


= bl 22% 
i-o 
= x2 
对 于 >w， 我 们 可 以 将 称 位 了 的 位 向 量 截 断 到 长 度 w， 得 到 [ti xor хо 057,0]. ЖАЗ 
X 2.7， 这 个 位 向 量 的 数 信 为 x2* mod2" =x*4 2* 。 因 此 ， 对 于 无 符号 变量 x，C 表达 式 кеек 等 价 
T x* pwr2k， 这 里 pwr2k 等 于 2。 特别 地 ， 我 们 可 以 用 JU«ck 来 计算 pwr2k。 
通过 类 羽 的 推理 ,我们 可 以 给 出 ， 对 十 一 个 位 模式 为 [Xj, ау, 知 ] 的 二 进 制 补 码 数 x+， 以 及 范 
围 0<k<w Е К, КД хо, 0 Ех»! ЫСЫ т. ВК, R 
于 有 符号 变量 x, CAJA A xexk ҰР xspwr2k， 这 里 pwk 等 于 25 
注意 ， 无 论 是 大 符号 运算 还 是 二 进 制 补 码 运算 ， 乘 羽 2 的 韩 都 可 能 会 导致 溢出 。 我 们 的 结果 表 
明 ， 即 使 滥 出 的 时 候 ， 我 们 通过 移 位 得 到 的 结果 也 是 一 样 的 ， 


1$ 3) 8 2.28 


就 像 我 们 和 将 在 第 3 章 中 看 到 的 那 栏 ，Intel 兼容 的 处 理 器 上 的 leal 指令 能 够 执行 a<<k+b 形式 的 


AE. 这 里 kK 或 者 等 于 人、1 或， 而 等 于 0， 或 者 等 于 某 相 程序 值 。 编 译 跨 常常 用 这 条 指令 来 执 
HERBATRA., Pie, RITAR асс1+а 来 计算 3*2, 
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用 这 条 指令 可 以 计算 a 659825 45382 


23.7 PREISE 

在 大 多 数 机 路 上 ,整数 除法 要 比 整数 乘法 更 慢 一 一 需要 30 i£ 5 E ЖЫР Л АЯ. 除 以 2 BUE 
可 氛 用 物 忆 和 运算 来 实 珊 ， 只 本 过 我 们 出 的 是 右 称 ， 而 不 是 堪 移 。 对 工 无 符号 和 一 进 制 补 码 数 ， 分 别 
使 用 迁 辑 移 位 和 算术 移 位 来 达到 日 的 ， 

整数 除法 总 是 舍 入 到 0 的 。 对 于 x >>0 和 y > 0， 结 休会 是 Lxwyj， 这 里 对 于 任何 实数 a Lal X. 
为 慌 一 的 整数 a ， 使 得 gz <a<a+ 1。 例如 ,13.14|=3, [-3.14j=-4 和 3j=3。 

考虑 在 一 个 无 符 配 数 上 执行 遇 辑 右 移 的 效果 。 设 x 为 位 模式 [x an a ETELE 6. 
M k ВАТ RJ O SK ewe x A v kho as xar ХЕС SR ПО АРЕ ЇЙ ТЫЗ, 


жї ЖЗ. 我 们 有 = Lu 证 明 如 下 : 根据 等 式 2.1, 我 人 有 x= a ars Y uH 


和 和 x= уух! 。 因 此 ， 我 们 可 以 把 х е, TURRA OS sir], 
КЕТЕТИН БҰТАҒЫН Lex УР Lr) ud. 
vp EUER SI, AA Eas қол, x DE SUB EE k {у ФЕ n E 
[0,9 0, x xat] 

LANAREN. ERE E ЛЕ ОФ ЩИ МЕНЕН. КЕ, ЯР 
LISE x. CEAR ok 等 价 于 x/pwrZk, AF pwr2k 等 价 于 2". 

现在 考虑 对 一 个 二 进 制 补 码 数 进 行 算术 布 称 的 结果 , 设 x HESS D, хр”. 各 | 表示 的 二 进 制 
补 码 整数 ,向 大 的 求 值 范围 为 0< < ws REA wk rx a x sss] л ӘШНӘ. 而 x 为 
Л k (E [хл до АУ АРЕ. 通过 对 无 花 号 情况 的 类 羽 分 析 ， 3418 x22 x «x^ lp 0 < < 2, 
得 到 x = x]. 此外， 我 们 可 以 观察 到 ， 算 术 币 移 售 向 量 [xz aen xb eds ӨЗІН 

| 

它 刚 好 就 是 将 [et, ыу”, ХА и ПРУГЕ] р Ви. ВАЕ, ЧИНУ ГЕТА у 
Н) ЕМА. 

对 于 >0， 我 们 的 分 机 表明 这 个 移 位 的 结果 就 是 所 期 望 的 值 。 不 过 ， 对 于 <0 和 y>0， 整 数 
除法 的 结果 应 谈 是 wy|， 这 电 ， 对 于 任何 实数 a, [a 被 定义 为 使 得 a -1 саха ӘЖ 整数 a'。 Юй 
ж, PARAN ЕНТ АЛАЛЫ АШ Б А, РИШ, С 表达 式 -5/2 得 到 -2。 因 此 ， 当 有 舍 入 发 
AER). # -个 负数 右 移 不信 不 等 价 于 把 它 除 以 关 。 例 如 ，-5 ЧИНУ по, ВТ 
AE 位， 我 们 得 到 [1101]， 这 是 -3 的 二 进 制 补 码 表示 ， 

我 们 可 以 通过 在 移 位 之 前 “ 偏 置 (biasing)” 这 个 值 ， 修 下 这 种 不 合适 的 伟人 。 这 种 技术 利用 的 
是 这 样 一 信 属 性， 对 于 整数 x AME у>0 y, [si] =|(x +y- 因此， 对 于 r<0， 如 果 我 们 在 
厂 称 之 前 ， 先 将 x 加 上 2-1， 那 么 我 们 就 会 得 到 正确 合 入 的 结果 了 。 这 个 分 析 表 明 对 ]- 司 用 算术 布 
称 的 二 进 制 补 公 机 器 ，C 表达 式 

{х<0 ? (x - (leek) - 1! : x) >> k 


ЗЕ xIpwr2k, 这 里 pwr2k З 2". ЖІП. 5 除 以 2, 我 们 先 加 上 偏 中 数 2-1 = 1, 得 到 位 模式 [1100]。 
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W HE KAA 1 位 得 到 位 模式 [1110]， 这 是 -2 的 二 进 制 补 码 表 示 ， 


ik 5] 2.29 
在 下 面 的 代码 中 ， 我 们 省 略 了 常数 M fe N 的 定义 ， 


&Gefine M /* Mystery number 1 */ 
define N /* Mystery number 2 */ 
int arithí[íint x, int y! 
{ 
int result = 0; 
resit = x*M + y/N; /* M and N are mystery numbers. %/ 
return result: 
} 
我 们 以 某 个 M 和 N 的 值 编译 这 段 代 码 。 编 译 器 用 我 们 讨论 过 的 方法 优化 乘法 和 除法 。 下 面 是 
将 产生 出 的 机 器 代 公 翻译 回 C 语言 的 结束 ; 
/* Translation of assembly code for ari-h */ 
in- optarith(int x, int y) 
{ 
int K = Xx; 
X <<= 4; 
X 一 二 L; 
if (y < 0) y += 3; 
y >>= 2; /* Arithmetic shift */ 
return x+y; 


) 
M 和 N 的 值 为 多 少 


练习 题 2.30 
假设 我 们 在 对 有 符号 慎 使 用 二 进 制 补 码 运算 的 2 位 机 器 上 运行 代码 ,对 于 有 符号 值 使 用 的 是 算 
术 右 移 ， 而 对 于 无 符号 值 使 用 的 是 届 辑 右 移 。 灾 量 的 声明 和 初始 化 如 下 ，; 


int x = foot»; /* Arbitrary value */ 
int y = bari}; /* Arbitrary value */ 


unsigned ux = x; 
unsigned uy - v; 


对 于 下 面 每 个 C 表 这 式 ， 或 者 证 明 对 于 所 有 的 x* 和 y 值 ， 它 都 为 真 (等 于 1), 或 者 给 出 使 得 它 
3HR (等 于 0) хя уй: 


А, [X >= Ü) 11 {{2*х) < 0] 

B. (x & 7) l= 7 || іх<<30 < 0} 
C. [x * x) >= 0 

D. x< < Ü || -x <= Ü 

E. X > Q || -x >= б 
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F. Х*у == ux*uy 
б. .X*y = uv*ux == -Y 


24 ih 


BROOKS V-x*2 BA SEDET SS. Ex IU B dE АЕ = (IV>>0). A Sor 
РО QVI<<1) ЖТ. ELA RUE Coe SERRE A, ЖЕН. 

直到 20 142280 年代， 每 个 计算 机 制造 商都 设计 了 自己 的 老 必 济 点 数 的 规则 ， 以 及 对 浮 点 数 
执行 运算 前 绷 节 。 另 外 ， 他 科 常 常 不 会 太 多 地 关注 这 算 的 精确 性 ， 而 把 实现 的 速度 和 简便 性 看 得 
比 数字 精确 性 更 重要 . 

大 约 在 1985 午 ， 这 些 情况 隐 着 IEEE 标准 754 的 推出 而 改变 了 ， 这 是 一 个 仔细 制订 的 表示 
浮 点 数 及 其 运算 的 标准 ,这 项 上 作 是 从 1976 年 Intel 发 起 8087 的 设计 开始 的 ,8087 是 一 种 为 8086 
处 理 器 提供 济 点 支持 的 芯片 。 他 们 雇 必 了 Wiliam Kahan， 加 州 大 学 伯克利 分 校 的 :位 教授 ， 作 
为 帮助 设计 未 来 处 理 器 浮 点 标准 的 顾问 。 他 们 支持 Kahan 加 入 一 个 IEEE 资助 的 制订 工业 标准 的 
委员 会 。 这 个 委员 会 最 终 采 纳 了 一 个 非常 接近 于 Kahan Jj Intel 设计 的 标准 。 日 前 ， 实 际 上 所 有 
的 计算 机 都 到 持 这 个 后 来 被 称 为 IEEE 浮 点 的 标准 。 这 大 大 改善 了 科学 应用 程序 丰 不 同 机 器 | 的 
n) ЖЕ. 


Sf. IEEE 〈 电 气 和 电子 工程 师 协 会 ) 
电气 和 电子 工程 师 协 会 (下 EE 一 一 读 做 “I-Triple-E” ) 是 一 个 包括 所 有 电子 和 计算 机 技术 的 专业 
哮 体 。 它 出 版 刊物 、 举 办 会 议 ， 并 且 建 立 协会 轩 体 来 定 闵 标准 ， 内 容 涉 及 从 电力 尾 给 到 软件 工程 . 


АСЫ, SUPR SI IEEE 浮 点 格式 中 数学 是 如 何 被 表示 的 。 我 们 还 将 探讨 会 入 《rounding ) 
的 问题 ， 当 一 个 数字 不 能 被 准确 地 表 泵 为 这 种 格式 ， 因 此 必须 被 问 上 调 申 成 者 向 下 调整 时 ， 就 会 
出 现 舍 入 ， 然 后 ， 我 们 将 探讨 加 法 、 乘 法 和 关系 运算 符 的 数学 属性 。 许 多 程序 员 认为 浮 点 最 没 意 
思 ， 而 用 最 深 熏 难 情 。 我 们 将 看 到 ， 因 为 IEEE 格式 是 定 六 在 一 组 小 而 БАНЫ, ЖЕЗ: 
际 上 是 相当 优雅 和 容易 理解 的 。 


2.4.1 二 进 制 小 数 

理 钥 浮 点 数 的 第 一 步 是 考虑 含有 小 数值 的 二 进 制 数字 。 首 先 ， 让 我 们 来 看 看 更 熟悉 的 |- 进 制 
表 小 法 。 上 上 进 制 表示 法 使 用 这 样 形式 的 表示 :dsd5.1…didod-1d.3…d 。， 其 中 每 个 十 进 制 数 a 的 取 
全 范围 在 0 一 9 之 加 。 这 个 表达 式 描 述 的 数 芝 定义 如 下 : 


d = Y 10 xd, 
数字 的 权 被 定 关 为 和 十 进 制 小 数 点 符号 “.” 相 关 ， 这 意味 着 点 左边 的 数字 的 权 是 ТО BER, 
得 到 整数 值 ， 而 点 右边 的 数字 的 极 是 10 ES, GS. ЯШ, 12344 KR CE 
1x10. + 2x108 + 3x10 ! L4x102 2422 n 
100 
AER, PIE TM lb b. bbb bb. НЫҒАЙ, ЖТЕ Т ЖЫШТ. УУ, 
b, ECL ЕЕ 0 一 ! 之 起 。 这 种 表示 方法 表示 的 数 户 定义 如 下 ， 
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b = Y 2 xh, (2.17) 


fps t." SESS ТЖ xx. ЛИН 2 EX. 点 右边 的 位 是 2 f. Dion, 
3 

4° 

从 等 式 2.17 中 可 以 很 容易 地 看 出 ， 向 左 移 动 二 进 制 小 数 点 一 位 相当 于 这 个 数 被 2 除 。 例 如 ， 


101.11, E ali 2 而 10.111, ЖТЖ 24045444121. 类 似 地 ,向 右 移 动 二 进 制 小 数 点 一 位 相 


101.11; zs E 1x 2 «0x2! - 1x28 1x 2! «1x2? EE 


当 于 将 该 数 滋 2。 例如 1011.1, & KR ES 4 0+2+1+-=15 А 


注意 形 如 0.11.1, BEBE НИР T LC B, Олло, 表示 三 ， 我 们 将 用 简单 的 表 
达 法 1.0-e 来 表示 这 样 的 数值 

假定 我 们 仅 考虑 有 限 长 度 的 编码 ,那么 -十进制 符号 是 不 能 准确 地 去 达 像 和 这样 的 数 的 类 
似 地 ， 小 数 的 二 进 制 表示 法 只 能 表示 那些 能 够 被 写成 x x 2 的 数 。 其 他 的 值 只 能 够 被 近似 地 表示 。 
简 如 ， 虽 然 加 长 一 进 制 表 水 能 够 提高 近似 表示 数 的 精度 ， 但 是 我 们 并 不 能 把 它 准确 地 表示 为 一 个 
二 进 制 数 ， 


5] 


0.00110011; 256 0.19921875,5 
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SIB 2.31 
填写 下 表 中 的 缺失 的 信息 





ЊУ) 2.32 

jt uk dS USE ЖИЕ Ж. 191 年 2 月 25 日 ， 在 海湾 战争 期 间 ， 沙 特 阿 拉 
伯 的 达 摩 地 区 设置 的 美国 爱国 者 导弹 ， 拦 截 仇 拉克 的 飞毛腿 导 阐 和 失败， 飞毛腿 导弹 击 中 了 美国 的 一 
个 兵营 ， 造 成 28 名 士兵 死亡 ， 美 国 总 审计 局 (САО 对 失败 原因 做 了 详细 的 分 析 [52]， 并 且 确 定 港 
在 的 原因 在 于 一 个 数字 计算 不 精确 ， 在 这 个 颖 习 中 ， 体 将 重 现 总 审计 局 分 析 的 一 部 分 ， 

爱国 者 导弹 系统 中 含有 一 个 内置 的 时 钟 ， 实 现 为 一 个 计数 器 ， 每 01 ыл ]。 为 了 以 秒 为 单 


位 来 确定 时 间 ， 程 序 将 用 一 个 24 位 的 近似 于 二 的 二 进 制 小 数值 来 乘 以 这 个 计数 器 的 值 .。 ЖЬ, 


10 
的 二 进 制 表达 式 是 无 穷 序列 
0000110011[00111…， 
其 中 ， 方 括号 里 的 部 分 是 无 限 重 复 的 。 计算 机 只 用 这 人 序列 的 开头 位 和 二 进 揣 小 数 点 丰 这 的 头 
闻 位 来 近 仆 地 表示 人 1。 我 们 称 这 本 教 为 x， 
А.х-01 的 二 过 制 表示 是 什么 ? 
B.x-0.1 的 近似 的 十 进 制 值 是 多 少 ? 
C. 当 系 统 和 初始 启动 时 ， 时 钟 以 0 开始 ， 并 且 一 直 保 持 计 数 ， 在 这 个 例子 中 ,系统 已 经 运行 了 大 
$3 100 4e 3p, 48/8 TE X 88 8E 8] do Эр ер] 2 5 $ y? 
D. ДЕЕ dk k Et S n esi dec x БЕ ЕДИ А, ДШГЕ Ж ЕЛЕШЕН. 
假定 飞毛腿 的 速率 大 约 是 2000 米 每 黎 ， 对 它 的 预测 偏差 了 多 少 ? 
正常 地 ， 一 个 通过 一 次 读 取 时 钟 得 到 的 绝对 时 间 中 的 轻微 错误 不 会 影响 跟踪 的 计算 。 反 而 ， 它 
应 该 依赖 于 两 次 连续 的 读 取 的 之 间 的 相对 时 间 。 问 题 是 过 国 者 导弹 的 软件 已 经 升级 成 使 用 更 精确 的 
函数 求 读 取 时 间 ， 但 是 不 是 所 有 的 通 数 调用 都 用 新 的 代码 替换 了 。 结果 就 是 ， 跟 踪 软 件 使 用 了 一 次 
读 取 的 是 精确 的 时 间 ， 但 其 他 软件 读 取 的 是 不 精确 的 吐 闻 [71]， 
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242 IEEE 浮 点 表示 

橡 前 一 节 中 谈 到 的 位 置 表示 法 不 能 很 有 效 地 表示 非常 大 的 数字 。 例如 , 表达 式 5x2” 的 表示 是 
由 ТОТ JE TER 100 个 零 的 位 模式 组 成 的 。 机 有 反 地 ， 我 们 希望 通过 给 定 x 和 yy 的 但 , ЖКМ x x 
LINE. 

IEEE ЕЖЕН V 2 (C1 x M x 2 的 形式 来 表示 个 数 : 

. 符号 (sign) s 决定 数 是 负数 Gu 还 是 正 数 (s=0)， 而 对 于 数值 0 的 符号 位 解释 作为 特殊 

情况 处 理 。 

. ЖЖЖ (significand) M 是 一 个 一 进 制 小 数 ， 它 的 范围 在 1 一 2-8 之 间 ， 或 者 在 0 一 1 之 间 。 

е 18% Сехролепі) E E 2 [€ (np BERE D. EITHER] ONERE AM DD, 

БАЛ НУ АН A Li. EAS. 

e 一 个 单独 的 符号 位 5$ ARRU s. 

«КТТ Я exp = e, еее НЕ E. 

. nhi SER frac = f. АНОН M. THE ЖИПЕК ГЕПАТИТИ ТЗ. 

在 单 精度 浮 点 格式 (СШ SUB floaD t, s. exp 和 frac 域 分 别 为 1 М. kB DERI n223 位 ， 产 
'E— 32 位 的 表示 。 在 双 精 度 浮 点 格式 (C 语言 中 的 double) Hš, s. exp 和 frac 域 分 市 为 1 V. k=11 
IV. HI nz52 du. PE- ба fy i Os. 

给 定位 表示 ， 根 据 exp 的 值 ， 被 编码 的 值 可 以 分 成 三 种 不 同 的 情况 。 

МЕДИ 

REI UR MB. "3 exp Jr AEA Л 0 OG 00, P RE СНОН ИН) 255, 
双 精 度数 值 为 2047) 时 ， 就 都 属于 这 类 情况 ， 在 这 种 情况 中 ， 指 数 域 解释 为 表示 偏 置 《biaged ) Ж 
Лее. CAEH, KAREE E = e-Bia, HP e 是 无 符号 数 ， 其 位 表示 为 e, "tere 
而 Bias 是 一 个 等 于 2-1 ( 单 精度 是 127， 双 精度 是 t023) 的 偏 置 值 。 由 此 产生 了 指数 的 取信 范围 ， 
对 于 单 精度 是 -126 一 +123， 而 对 于 双 精 度 是 -1022 一 +1023， 

XO frac 解释 为 描述 小 数值 刀 其 中 0SF< 1， 其 二 进 制 表示 为 0P vof ШЕ ЭК 
数 点 在 最 高 有 效 位 的 左边 。 有 效 数 定 义 为 目 = 1 р 有 时 ， 这 种 方式 也 叫做 隐 念 的 以 1 为 开头 的 

(implied leading 1) 表示 ， 因 为 我 们 可 以 把 版 看 成 一 个 二 进 制 表达 式 为 Lo f A КТ. WEAR 

我 们 总 是 能 够 调整 指 北 E ERAAN М 在 范围 ] < M< 2 之 中 【假设 没有 洲 出 )， 那 么 这 种 表示 方 
法 是 一 种 学 费 获 得 “个 额外 精度 位 的 技巧 。 既 然 第 一 位 总 是 等 于 1， 那 么 我 们 就 不 闹 要 显 式 地 来 表 
ЖЕТ. 

非 规格 化 值 

当 指 数 域 为 全 0 时， 所 表示 的 数 就 是 非 规格 化 形式 的 。 在 这 种 情况 下 ， 指 数值 荐 = ] - Bias, 
而 有 效 数 的 值 是 版 =f， 也 就 是 小 数 域 的 值 ， 不 包含 隐 仿 的 开头 的 1。 


旁 注 ， 为 什么 对 于 非 规格 化 佳 著 这 样 设置 仿 置 值 ? 


1£ 3846405. 1- Bias 而 不 是 简单 的 -Bias 似乎 是 违反 直觉 的 。 我 们 将 很 快 看 到 、 这 种 方式 提供 了 
一 种 从 非 规格 化 值 平 淆 转换 到 规格 化 值 的 方法 ， 


非 规格 化 数 有 两 个 日 的 。 首 先 ， 它 们 提供 了 一 种 表示 数值 0 的 方法 ， 因 为 使 用 规格 化 数 ， 我 们 
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P ma EEM? BA КАЕ а 0. ШАР, 0.0 Е ka КИЙА А 0: 符号 位 是 0, 
指数 域 全 为 0〈 表 明 是 AEREE) mop ORI 0, НА М=]=0. ЛЯНЕ, 
当 符号 位 为 1,， 亿 是 其 他 域 全 为 时， 我 外 得 到 值 -0.0. 根据 IEEE 的 浮 点 格式 ， 值 H00 和 -0.0 {Т Ж 
些 方面 被 认为 是 不 同 的 ， 而 在 其 他 方面 是 相同 的 。 

非 规格 化 数 的 另外 一 个 巧 能 是 用 来 表 小 那些 非常 接近 于 00 的 数 。 它 们 提供 了 一 种 属性 ， 称 为 
逐渐 溢出 《gradual underflow)， 其 中 ， 可 能 的 数值 分 布 均 名 地 接近 于 0.0. 

ЖКН 

最 后 一 类 数值 是 当 指 数 域 全 为 АЕ Р, "322 ОМ. 20090 8 ЫЯ. Dis 
0 B Eee, 或 者 当 х= Е-е. ЧЕ АРТ АЕ, RARER Aye Kon 
流出 的 结果 。 当 小 数 域 为 非 零 时 ， 疆 果 值 被 称 为 “NaN "， 就 是 “不 是 - ' 个 数 【Not a Number)” 的 
жы, 一 些 运算 的 结果 不 能 是 实数 或 无 穷 ， 就 会 返回 这 样 的 NaN 值 ， 比 如 当 计算 -1 或 =-o 时 ,在 
某 些 应 用 中 ， 用 来 表示 未 初始 化 的 数据 ， 它 们 也 很 有 用 处 。 


243 数值 示例 
图 2.22 ЕТ “组 数值 ， 它 们 可 以 用 假定 的 5 位 格式 来 表 本 ， 有 大 = 3 的 指数 位 和 n=2 的 有 效 
Wr. AARE? -1 = 3。 图 中 的 A 部 分 显示 了 所 有 可 表示 的 值 (除了 NaN)。 两 个 无 穷 值 企 册 个 
Ж, 规格 化 数 上 其 有 的 最 人 数量 级 是 +14。 非 规格 化 数 案 集 在 0 的 附近 ， 在 图 的 B 部 分 中 ， 我 们 只 
展示 了 介 于 -10 和 +1.0 之 间 的 数值 ， 这 样 这 部 分 就 能 够 看 得 更 加 清楚 了 。 两 个 雪 是 特殊 的 非 规格 化 
数 。 可 以 观察 到 ， 那 些 可 表示 的 数 并 不 是 均匀 分 布 的 一 一 它们 车 越 靠 近 原 点 处 趣 稠 窗 。 
全 部 范围 





FARA ЖЮН ^ Ao 





非 规格 化 佣 规格 化 值 ЖЗШ 


图 2.22 нА ЖЕНЕ 
Hf К=з ИЕ ЫЯ n = 2 Яо. ERES. 


il 223 展 水 了 假定 的 8 位 浮 点 格式 的 示例 ， 其 中 有 上 = 4 的 指数 位 和 n=3 的 小 数位 。 偏 置 量 

是 2“!-1=7。 图 被 分 成 了 二 个 区 域 ， 来 拱 述 二 类 数字 。 从 0 8, Boum 0 KERREN. 2 

种 格式 的 非 规格 化 数 的 E=1-7=-6,， 得 到 25 = = ШІ MEARE t 从 而 得 到 数 Y 
7 7 


Ш о, 
НЕ 8x64 512 


ml 


0 000й 090 


LL 


БЕЛЕ 0 00022 


ш | w [r2 Ds | 一 


F WIESE Ж 


«о |-і ш | с 


® ЛЕ at 38 0 0001 


节 尖 的 规格 化 数 J 1110 
? 1111 020 


2.23 8 (ur XE йт ЗЫ АД 
A &=4 WES ИИ я ЗЕН. {Өй ЕТ. 


ою {ы wle оа 1 


сс | чо ас | оо | ое {а cod 
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8 
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8 
10 
П 





71 


72 82% 


АЕ Е-І-7--6. JER A W ЕНЕ 01,22. 然而 ， 有 效 数 


ax 7 15. 8 , 
(SE 1+0=1 8], Н VERB — 一 一 一 之 间 。 
8 8 512 512 


п] PAL БЕ ЗЕН EC = МЕТАН => 之 间 的 平滑 转变 , 这 种 平滑 性 归功 丁 我 们 


ЖЕНЕ E 的 定义 。 通 过 将 E 定义 为 1-Bias， 而 不 是 -Bias， 这 样 我 们 可 以 补习 非 规格 化 数 约 
有 效 数 没 有 隐 售 的 开头 的 1。 
当 我 们 增 大 指数 时 ， 我 们 成 功 地 得 到 更 大 的 规格 化 值 ， 经 过 1.0， 然 后 得 到 最 大 的 规格 化 数 。 


这 个 数 具 有 指数 下 = 7, 得 到 一 个 权 2° = 128。 小 数 等 十 二 得 到 有 效 数 M = 。 因 此, 数 信 是 V= 240. 


起 出 这 个 值 就 会 游 出 到 +ee。 

这 个 表达 式 具 有 一 个 有 趣 属 性 ， 想 如 我 们 将 图 2.23 ФИАН ААС У Е, E 
们 就 是 授 升 序 排 列 的 ， 喜 像 它们 表示 的 笃 点 数 一 样 。 这 不 是 偶然 的 一 一 IEEE 格式 如 此 设计 就 是 为 
了 泽 点 数 能 够 合用 整数 排序 遇 数 来 进行 排序 。 当 处 理 负 数 时 ， 有 一 个 小 的 礁 点 ， 因 为 它们 有 开头 
的 1]， 并 且 它 们 是 控 照 降序 出 现 的 ， 但 是 不 天 要 泽 点 运算 来 进行 比较 也 能 解雇 这 个 问题 【参见 练 
习题 2.56), 


练习 是 2.33 

假设 一 个 基于 IEEE 浮 点 格式 的 5 位 浮 点 表示 ， 有 1 个 符号 位 ，2 АЛЕЯ (&=2) 和 两 个 小 数 
Ë (nz2) HALET -1= 1， 

下 表 中 列举 了 这 个 5 位 浮 点 表示 的 全 部 非 负 取 值 范围 。 使 用 下 面 的 条 件 ， 填写 表 格 中 的 空白 项 ， 

e: 髓 定 指数 域 是 一 个 无 符号 整数 所 表示 的 值 ， 

Е. f E.) SAEE. 

f: ОТЖЕ. | 

M: ЖЕ. 

用 形 如 了 的 小 数 表示 六 种 和 VV 的 值 ， 被 “一 一 ”标注 的 条 有 目 不 用 填 . 





ЕТЕ 23 





[Н 224 Бок о ТАНЕ НО ЕНЕ А ОНС ЕН ЗЕ В 223 中 展示 的 8 位 格 
Xo ПЕНЕН К {ЧЕ ДА n М АНЕ АЖ ЛОН ІН 


а ei ei 49х10 19 


ROBUR UR ur e (1-62 1% 12x 19 (1-px 27 К” 22x10 55 
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ЁН 2.24 非 负 浮 点 数 的 示例 





e 值 +0.0 总 有 一 个 全 为 0 的 位 表 水 。 

。 最 小 的 正 《positiye》 非 规格 化 从 有 一 个 位 表 小 ， 是 由 景 低 有 效 位 为 1 而 其他 所 有 位 为 0 构 
RR EREDE MERKO (Mcf-2"3— EX E--2 +2。 因 此 它 的 数字 值 
是 Vy 9- 

* 最 天 的 非 规 烙 化 值 的 俺 模式 是 由 全 为 和 的 指数 域 和 全 为 1 的 小 数 域 组 成 的 。 它 有 小 数 ОП 
ARIDE M= у= 1-2 所 我 们 写成 ]-e) 和 指数 值 上 = -2” + 2, 因 此 ,数值 V -d-27)x27 =, 
XXX EE P] UR LAB Л A. 

* RE (positive) Mist ATIS) a ЛАН ЕНЕДІ, ДНЕ 0. 它 的 有 
就 数值 М=1, ИШЕ ЇН Е=-2^ +2. К. #{Цу-2' 。 

. {Н LO 的 位 表示 的 指数 域 除 了 最 高 有 有效 位 等 于 | 以 处 ， 其 他 位 都 等 于 0。 它 的 有 效 数值 是 
М=1, ШЕЕ А Е E= 0, 

s 最 大 的 规格 化 值 的 位 表示 的 符号 位 为 0， 指数 的 最 低 有 效 位 等 于 0， 其 他 位 等 于 1。 它 的 小 
数值 f= 1-2"， 有 效 数 M =2-2* (我 们 写作 2-e)。 指 数值 = 2 1， 得 到 数值 Y = (2727) 
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x2? 4z(|-27 ) x01, 

对 型 解 洱 点 表示 很 有 几 的 一 个 练习 是 把 样本 整数 值 转换 成 浮 点 形式 。 例如, 在 图 2.10 中 我 们 看 
%|12345 HH ЕЙ [11000000111001]. 通过 向 二 进 制 小 数 点 右边 移动 13 位 ， 我 们 创建 这 个 数 
Br cre. 851 12345 = 1000000111001, x2. 5 JH IEEE ВНЕ ЙЫН. ІЗ 
ЯТ, 并 用 在 末 此 增加 10 个 0, KAR К, 得 到 二 进 制 表示 [10000001110010000000000j 。 
^P [fg ВАГИ Ba SERRE 127 到 13, 得 到 140, Ж zb UR Xy [10001100]. 加 上 上 符号 位 0, 
KW 4 81 — d b E] 256 t k [01000110010000001110010000000000]. [| — F 2.1.4 55, RAMS 
到 整数 值 12345 (0x3039) 和 单 精 度 溯 点 值 12345.0 (0х4640Е400) 在 位 级 表示 上 有 下 列 关 系 ; 

C 0 0 0 3 9 3 9 

00000000000000000011000000111001 


k cock c Ww k K ха X 


4 6 4 Ü E 4 O 0 
01000-1009100309011109910000000000 


现在 我 们 可 以 直到， 相关 的 区 域 对 应 于 整数 的 低 售 ， 刚 好 在 最 高 的 等 于 1 的 位 之 前 停 让 《这 个 
ЙЕНІ АНУ 1)， 和 和 浮 点 表示 的 小 数 部 分 的 高 位 是 相 匹 配 的 。 


练习 题 2.34 


正如 在 练习 题 2.6 中 提 到 的 ， 整 数 3490503 的 十 六 进 制 表示 为 0x354321， 而 单 精度 浮 A 
3490593.0 的 十 六 进 制 表示 为 Tp4AS50C84。 推 导出 过 个 浮 点 表示 ， 并 解释 整数 和 和 浮 卡 数 琢 示 的 位 立 
间 的 关系 。 


ЖЕН 2.35 

А. 候 吓 一 个 大 位 指数 和 于 从 小 数 的 浮 点 烙 式 ， 给 出 不 能 准确 描述 的 最 小 正 整 数 的 公式 【因为 
想 准 确 表示 它 需 要 nl 位 小 数 】 

B. 对 于 单 精 度 格 式 (i28. n-23) iXX cn Eo E R $ y? 
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因为 表示 方法 限制 了 注 点 数 的 范围 和 精度 ， 所 以 浮 点 运算 只 能 近似 地 表示 实数 运算 ， 因 了 此， 对 
FE х. R-RE НАА. БЕКЕҢ RW” ИИО G^. ЫШ IT UE. 
式 表 下 出 来 。 这 就 是 舍 入 〈rounding) 运算 的 任务 。 关 键 问题 是 定义 在 两 个 叮 能 值 中 间 的 数值 的 舍 
^J]. Bun, SEGUE 1.50 美元 ， 想 把 它 合 入 到 最 接近 的 美元 数 ， 结 果 应 该 是 选择 1 美元 还 是 2 
AUN? 一 种 中选 择 的 方法 是 维持 实际 数字 的 下 界 和 上 界 . 例如 ,或 们 可 以 确定 可 表示 的 值 x* 和 x°, 
使 得 x 的 值 位 于 它们 之 全; xc «x x^. IEEE 浮 点 格式 定义 了 四 各 不 辐 的 全 入 方式 。 默认 的 方法 是 
找到 最 接近 的 匹配 ， 而 其 他 三 种 叮 用 于 计算 上 界 和 下 界 。 

5 225 举例 说 明了 四 种 合 入 方式 ， 和 将 一 个 金额 数 合 入 到 最 接近 的 整数 |。 向 偶数 使 入 
(round-to-even), PARA p] ВО НЕҢ ҒА (round-to-nearest)， 是 默认 的 方式 。 它 试图 找到 一 个 
最 接近 的 匹配 值 。 因 此 ， 它 将 1.40 л Ар ] 美元 ， 而 将 1.60 美元 舍 入 成 2 美元 ， 因 为 它们 是 
ERO SECOS UE. ME 的 设计 决策 是 对 位 于 两 个 叮 能 结果 中 间 的 数值 的 会 入 。 向 偶数 舍 入 方式 
末 用 的 方法 是 ， 它 将 数字 向 上 或 者 向 下 舍 入 ， 使 得 结果 的 最 低 有 效 数字 是 偶数 。 因 此 ， 这 种 方法 将 
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1.5 美元 和 2.5 美元 都 合 入 成 2 美元 。 
Lis suo ne [sm em [siso 


[3] 836 ir À 
Ia] E ^ir А, 
B F uA 
向 上 会 入 







8225 会 入 方式 说 明 
-种 方法 舍 入 到 - 个 最 接近 的 值 ， 而 其 他 二 种 方法 向 上 或 周 下 限定 结果， 


其 他 二 种 方式 产生 实际 值 的 确 异 (guaranteed bound)。 这 些 方法 在 一 些 数字 应 用 中 是 很 有 用 的 。 
ПЗА ЗЕТЕ А РА, ЗЕЛА А, На, х. РА ЕТЕ 
和 负数 都 向 下 舍 入 ， 得 到 值 x* ， 使 得 x Sx. ЮЕ АЛ Kini Cap ЖА, BAÉ х, 
WE x< x, 





?为 什么 不 始终 把 
位 于 两 个 可 老 示 的 值 中 间 的 值 都 癌 上 舍 信 呢 ? 使 用 这 种 方法 的 一 个 问题 就 是 很 容易 假想 到 这 样 的 情 
ж: 这 种 方法 全 入 一 组 数值 ， 会 在 计算 这 些 值 葛 平均 数 中 引入 统计 偏振 。 我 们 末 用 这 种 方式 会 入 得 
到 的 一 组 数 的 平均 值 将 比 这 些 数 本 上 身 的 平 坞 什 上 略 高 一 些 。 相 反 ， 如 果 我 们 总 是 把 汕 个 可 表示 值 中 间 
的 数字 向 下 舍 入 ， 那 么 车 入 出 的 一 组 数 的 平均 值 将 比 这 些 数 本 身 的 平均 值 略 低 ~- 些 。 向 偶数 会 入 在 
大 多 数 现 实情 况 中 避免 了 这 种 统计 偏差 。 在 和 各 的 时 间 里 ， 它 将 国土 舍 信 ， 而 在 ЗБЕН, С 
将 向 下 舍 入 。 

其 至 在 我 们 不 想 舍 入 到 整数 时 ， 也 可 以 使 用 向 偶数 舍 入 。 我 们 只 是 简单 地 考虑 最 低 有 效 数字 是 
奇数 还 是 偶数 。 例如， 假设 我 们 想 将 十 进 制 数 含 信 到 最 莱 反 的 百 分 位 ， 不 管用 那 种 舍 信 方式， 我们 
部 将 把 1.2349999 会 入 到 1.23， 而 将 1.2350001 & A | 1.24， 因 为 它们 不 是 在 123 和 1.24 的 中 间 。 
另 一 方面 我 们 将 把 两 个 数 1.2350000 和 1.2450000 都 多 入 到 1.24, HA4 是 偶数 。 

相似 地 ， 同 暗 数 舍 和 法 能 够 运用 在 二 进 制 小 数 土 。 我 们 将 最 抵 有 效 倍 的 值 为 0 VOS ERG 1 
认为 是 奇数 , 一 般 来 说 , RAIEN %E… 和 FF…Y100… 的 二 进 制 们 模式 的 数 , 这 种 会 入 方式 省 有 效 ， 
Hh xA YEPERE. RAK Y 是 要 被 会 入 的 位 置 。 只 有 这 种 位 模式 表示 在 两 个 可 能 的 值 
rnm. 例如， 考虑 会 入 值 到 最 近 的 四 分 之 一 的 问题 (也 就 是 ， ОМАН АРЫУ ІП 


10.0011, (2 一 ) 向 下 合 入 到 10.00, (2), 10901104 2— уй EAS 001427) 因为 这 些 值 不 是 两 
个 可 能 信 的 中 间 值 。 我 们 将 10.111004 2 二 ) 向 上 会 入 成 100,0). M 1010100, H KEAR 
10.10x 2 二 )， 因 为 这 些 值 是 两 个 可 能 信 的 中 间 依 ， 并 已 我 们 全 向 于 使 最 低 有 效 位 为 零 
245 浮 点 运算 

IEEE 标准 为 诸如 加 法 和 乘法 这 样 的 算术 运算 的 结果 定义 了 简单 的 规则 。 把 浮 点 值 * 和 y 看 成 实 


数 ， 而 某 个 运算 后 定义 在 实数 上 ， 计 算 将 产生 Round (x 7)， 这 是 实际 运算 的 精确 结果 进行 舍 入 后 
的 结果 。 在 实际 中 ， 浮 点 单元 的 设计 者 使 用 -- 些 聪明 的 小 技巧 来 避免 执行 这 种 精确 的 计算 ， 因 为 计 
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算 只 要 精确 到 能 够 保证 得 刘 -个 正确 舍 和 的 结果 就 可 以 了 上. 当 参 数 中 的 一 个 是 特殊 植 ， 关 -0、-ee 或 
NaN 时 ，IEEE 标准 定义 了 一 些 梗 之 更 合理 的 规则 。 和 从 如 ，1/-0 被 定义 为 产生 -we， 而 10 ЖЕ 
РЕ ко. 

IEEE 标准 中 指定 评 名 运算 行为 的 方法 的 一 个 优点 在 于 , 它 可 以 独立 于 任何 有 共 体 的 在 件 或 者 软件 
实现 。 因 此， 我 们 可 以 检 人 入 它 的 抽象 数学 属性 ， 而 不 必 考 虑 它 实 际 上 是 如 和 何 实现 的 。 

3r EE RO 了 整数 如 法 《无 符号 和 和 二进制 补 码 ?， 形 成 了 阿 贝尔 群 。 实 数 上 的 如 法 也 形成 了 
阿 贝尔 群 ， 钥 是 我 们 必须 首 虑 舍 和 对 这 些 属 性 的 影响 .我 们 定义 x+ yA Roundy). RARER 
EAE xA у ARARE КОЕТ RECREA. WAE х Жу 者 是 实数 。 对 于 所 有 工程 
y 的 值 ， 这 个 运算 是 可 交换 的 ， 也 就 是 说 Y+iy=y+x 另 一 方面 ， 这 个 运算 是 不 可 结合 的 。 例 如 ， 
使 用 单 精 度 浮 点 ， 表 达 式 (3.14He10}lel10 SK f (8. 86 0.0—— B3) A A. (8 3.14 E EX. 5 — ЛІ, 
表达 式 3.14+(le10-le10) 得 出 值 3.14。 作 为 阿 贝 尔 群 , 大 多 数值 在 浮 点 加 法 下 都 有 赣 元 ,也 就 是 说 x+-Y 
= 0). MAHENE (AH +o- = NaN) 和 NaN， 因 为 对 于 任何 x， 部 有 NaN + x = NaN, 

浮 点 加 法 不 具有 结合 性 ， 这 是 缺少 的 最 重要 的 群 属性。 对 于 科学 程序 员 和 编 详 器 编 与 者 来 说 ， 
ARAB AM. Е-Е ЕЕ ГІ МЫН: 


х a +b + о; 


y =b +c + d: 
编 详 器 可 能 试图 通过 产生 下 列 代码 来 省 去 一 个 浮 点 加 法 : 


Ё= Б + ес; 
x =a “ж; 
y = t +4; 


Ж, STT ck. WATA BE т ЛАГАНЕ КИВ, RACEN T anis STR SII 
PAX. КАРУН, RPR ЕШ d. ТЫА Ж. ДЕДЕ, ҮЗЕН MED E 
ЖАЛЫ FABPRURIHUITIA AR. RARER АВЕО RERE BERE. ЕТІН 
ЕКЕЖ ЖАГ. ЖА ЙЕ axr Be PI t ЩН. BIER ЇН ЕКПЕ Ы. 

AAH. РА MAWKA [o cO GENTE: жаг. ЖАЯ PIEI aA big 除了 x 
不 等 于 NaN, Н х+а>х+Ьь XXE (U AK б) 加 法 的 属性 不 被 无 符号 或 一 进 制 补 码 如 法 所 
遵守 ， 

浮 避 乘法 也 遵循 道 常 乘法 所 具有 的 许多 属性 ,也 就 是 环 的 蕊 性 .我 们 定义 x y. 为 Round (x x yh 
这 个 运算 在 乘法 中 是 圭 闭 的 【虽然 可 能 上 产生 无 穷 大 或 Naw)， 它 是 可 交换 的 ， 而 且 它 的 乘法 单位 元 
为 1.0。 风 方面， 由 于 可 能 发 后 浇 出 ， 或 者 由 于 合 入 而 失去 精度 ， 它 不 具有 上 吕 结 侣 性 ,例如 ， 单 
精度 注 点 情况 下 ， 表 认 式 (le20*le20)*je — 20 求 值 为 ee， 厕 le20#(le20*le — 20) 将 得 出 1e20. 895% 
点 飞 法 在 如 法 上 不 具备 分 配 性 。 例 如 ， 单 辅 度 浮 点 情况 下 ， 表 达 式 le20*(e20 – le20y А 00, ifi 
le20*le20 - le20*1e20 会 得 出 NaN. 

9-1, Я ТАНА a. blc. ЖПа. 志和 ce 都 不 等 于 NaN, Pe h Анд, RAPERE 

a2b Пс>0 — a"czb"e 
a>b BE с<0 > а с<ь с 

此 外 ， 我 们 还 可 以 保证 ， 只 要 az NaN， 就 有 a iaz0 。 像 我 们 先前 所 在 利 的 ， 无 符号 成 一 进 

制 补 码 的 乘法 没 存 这些 单调 性 属性 。 
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ХРА АНАН НЕН Ж. ААН МЕРЕ. ВУ К 
ПЕ аА О Е FS CABIERNIES, E ARER AARAA 
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C Ж {ЕТ Rh ЖІБІ h Ж 54), float 和 double。 在 支持 IEEE 浮 点 格式 的 机 器 上 ， 这 些 数 
据 类 型 就 对 烹 于 单 精度 和 双 精 度 浮 点 。 男 外 ， 这 类 机 吴 使 用 辐 侦 数 当 入 的 多 入 方式 。 不 垃 的 是 ， 因 
Jj C 标准 不 监 求 机 器 使 用 IEEE 泽 点 ， 所 以 没有 标准 的 方法 来 改变 舍 入 方式 成 者 得 到 诸如 -0、+ee、 
-oo 或 者 NaN 之 类 的 特 跌 值 。 大 多 教 系 统 提供 include (“h”) 文件 和 读 取 这 些 特 征 的 过 程 库 ,， 但 是 细 
节 随 系 统 不 司 而 不 同 。 例如 ， 当 程序 文件 中 出 现下 列 句 子 时 ，GNU 编译 器 GCC 会 定义 宏 INFINITY 
(Жеке) Ж МАМ (ЖҰЖ NaN); 


% derine GNU SOURCE 1 
Я include «math.h- 


练习 站 2.36 

完成 下 列 宕 定义 ， 生 成 双 精 度 值 Ho、-co 和 O, 

#define 206 INFINITY 

#def ine NEG INFINITY 

#define ҢЕС ZER2 

endif 

不 能 使 用 任何 include 文件 【例如 math.h })， 但 你 能 利用 这 样 一 个 事实 : 能够 表示 成 双 精 度 的 最 
KHARE. AHE 1.810". 


Уй: int. float 和 double 格式 之 则 进行 强制 类 型 转换 时 ， 程 序 按照 如 下 原则 来 转 模 数值 和 位 模 
x CE ini дж 32 49085): 
s 从 int 转换 成 float. SEE zd. {НД ТТЕ a А. 
• 从 int 或 float 转换 成 double, AA double 有 更 人 的 范围 《也 就 是 串 表 示 值 的 范围 )， 也 有 更 
高 的 精度 (也 就 是 有 效 位 数 )， 所 以 能 够 保留 精确 的 数值 。 
• 从 double 转换 成 float， 因 为 范围 要 小 一 些 ， 所 以 值 可 能 溢出 成 + 或 -m。 另 外 ， 由 于 精确 
度 较 小 ， 它 还 可 能 被 会 入 。 
е ДА float RE double 转换 成 int， 值 将 会 向 0 截断 。 钢 如 ，1.999 将 被 转换 成 |， 而 -1.999 将 
被 转换 成 -1。 注 音 这 种 行为 与 舍 入 是 非常 相同 的 。 进 一 步 来 说 ， 值 可 能 会 洲 出 。C 标准 没 
有 对 这 种 情况 指定 装 定 的 结 虹 ， 但 是 在 大 部 分 机 器 上 上， 结果 将 是 ТМах, Ё ТМ, Аф w 
是 int 中 的 位 数 。 
*Intel IA32 浮 点 运算 
在 下 一 章 中 ， 我 们 将 深入 研究 Intel 1432 处 理 器 ， 这 种 处 理 器 大 量 地 应 用 于 今天 的 个 人 计算 机 
中 。 这 里 我 们 重点 罕 出 这 种 机 器 的 一 个 特性 ， 用 GCC 编译 的 时 候 ， 它 能 够 严重 影响 程序 对 浮 点 数 
运算 的 行为 。 
像 大 多 数 其 他 处 理 器 一 样 ，LIA32 处 理 器 有 特别 的 存储 器 元 素 ， 称 为 寄存 器 ， 当 计算 或 者 使 用 浮 
尽 笋 时 ， 用 来 保存 洋 点 值 ， 比 起 保存 在 主 存 中 的 值 , 保 存在 寄存 器 中 的 值 读 写 起 来 更 快 。LA32 非 同 


7$ 42% 


一 般 的 属性 是 , 浮 点 寄存 器 使 用 … 种 特殊 的 80 бу КШ ЖЕКЕ, ERE RE EG r d CERE SUP R8 Pr 
使 用 的 普通 32 位 单 精度 和 64 位 双 精 度 格 式 ， 提 供 了 更 大 的 表示 范围 和 更 高 的 精度 。 和 在 家 庭 作 中 
2.58 中 描述 的 一 样 , 扩展 精度 表示 关羽 于 具有 15 位 指数 5 也 就 是 上 15)7 和 63 位 小 数 { 人 也 就 是 n=63) 
的 IEEE 浮 点 格式 。 所 有 的 单 精度 和 观 精度 数 在 从 存储 器 加 载 到 浮 捐 寡 存 器 中 时 ， 者 会 转换 成 这 种 
格式 。 运 算 总 是 以 扩展 精度 格式 进行 的 。 当 数字 存储 在 存储 器 中 时 ， 它 外 就 从 扩展 精度 转换 成 单 精 
度 成 者 双 精度 格式 。 

对 于 程序 员 而 言 ,这 种 把 所 有 寄存 器 数据 扩展 成 80 人 忆 , 并 把 所 有 在 储 器 数据 收缩 成 更 小 的 格式 ， 
会 产生 : 锯 不 太 好 的 铺 果 。 这 意味 着 在 存储 器 中 保存 一 个 值 ， 然 后 取出 它 就 会 由 于 售 入 、 下 溢 或 者 
а. ЖЕРИ. ЖАЗСА ЖЫН, 这 种 存 入 和 取出 并 不 总 是 可 见 的 , SFA 些 奇 特 的 结果 ， 

下 面 的 示例 说 明了 这 个 性 质 











—————— --------------- c0de/dataffcomp.c 
1 double recipiint derom) 
2 1 
3 return 1.0/7 (double) denom; 
4 j 
^ 
б void do nothingií! {} /*Iustlike the name says */ 
ў, 
8 void testl[int дело} 
3 d 
10 doub.e rl, r2; 
1i int tl, t2; 
i2 
13 rl = recipidenom);  /*Stored m memory */ 
14 r2 = recipidenom);  /*Stored in register */ 
15 tl = rl == rà; /* Compares register to memory */ 
16 do nothing(); /* Forces register save to memory */ 
17 t2 = rl == rž; /* Compares memory to memory */ 
18 printfí("tes-l tl: rl $f $c- r2 ҰҒАР", rl, tl ? '-' ; '!', r2); 
19 printfí("test]l t2: rl ФЕ %с- гә РАП", rl, t2 ? '=' í Flr, r2]; 
20 1 
n code/dafeomp.c 


4 ті Jü 2 是 由 有 相同 参数 的 相同 函数 计算 的 。 我 们 会 预计 它们 是 相 同 的。 而 且 ， 变 好 t1 和 
О 都 是 通过 对 表达 式 r1==r2 求 伯 计算 出 来 的 ， 所 以 我 们 扎 计 它们 都 等 十 1。 没有 明显 的 隐藏 的 副 作 
Ш—Ю# recip fr EFE UNE SE. ЫЗА do nothing RETH TEBE, tama 
干 。 然 而 ， 当 带 优 化 选 顺 “-O2” 编译 ， 并 用 参数 10 运行 这 个 文件 时 ， 我 们 得 到 下 列 结果 ; 

testli ti: r` D.100200 '- r2 5,]00000 

testl t2: к. 0.100200 zz r2 0.100000 

58 — ИЛАН 9E ROI DERI. 而 第 二 个 测试 又 说 它们 是 相同 的 ! 这 当然 不 是 我 们 预想 的 ， 
也 不 是 我 们 想 要 的 ,理解 这 个 例子 的 全 部 网 节 需 要 我 们 学 习 GCC 产生 的 机 器 级 代码 (参见 3.14 35), 
但 是 慌 码 中 的 注释 提供 了 为 什么 会 出 现 这 样 结果 的 线索 。 孙 数 recip 计算 的 数值 返 同 结果 到 浮 点 寄 
TER IP. 大 论 何 时 过 程 testl 调用 某 个 隙 数 ， 它 必须 焰 浮 点 寄存 器 中 的 当前 秆 枯 鱼 到 主 程序 栈 中 ， 这 
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EAR a АЕ Е УНИ r. АЛЕН, ЖИ Ж ЖГ RAR A ЛЕШ ЖИЕНИ АН НИЕ 
存 情 器 值 。 因 此 ， 在 第 二 次 调用 recip《〈 第 14 行 ) 00), ЖЕП 被 转换 并 存储 成 双 精 度数 了 。 在 第 
二 个 调用 之 后 ， 变 量 己 有 函数 返回 的 有 展 精度 值 。 在 计算 上 时 【第 15 行 )， 双 精度 数 7] 与 扩展 精 
度数 DL ЖЕЖ. 因为 03 不 能 精确 地 被 任何 一 种 格式 表示 ， 所 议 济 试 的 结 骨 是 很 。 华 调用 函数 
do nothing 《第 6 行 ) 之 前 ， 被 转换 并 只 存储 成 双 精 度数 。 在 计算 包 时 【第 17 行 )， 比 较 的 是 两 
个 双 精 度数 ， 得 到 结果 为 真 。 

这 个 示例 证 明了 在 1A32 机 器 上 GCC 的 一 个 缺 险 ( 在 Linux 和 Microsoft Windows 系统 上 也 有 相 
同 的 结果 )。 由 于 对 程序 员 来 说 不 可 见 的 运算 , 例如 祁 点 寄存 器 的 保存 和 恢复 , 变量 的 值 发 生 了 改变 。 
我 们 对 Microsoft Visual Сн А ЕН ЕНІН ІН. 

S 我们 为 什么 要 关心 这 些 示 一 致 ? 

ERMES SEHH. РАҒАН ЖЕЖАН?.-А, ARREST., ВААЙ 

TEARRE., TEHE, ССС ТАЗ AA EFE ALICE GEL $ K, 


有 一 些 方 法 来 解决 这 个 问题 ， 不 过 都 不 是 很 理想 。 最 简单 的 方法 就 是 用 命令 行 选项 
^ -float-store” 来 调用 GCC， 告 诉 GCC 每 一 个 削 点 计算 的 结果 在 使 用 之 前 都 必须 存储 到 存储 器 中 ， 
骨 读 回来 。 这 将 迫使 每 个 被 计 算出 来 的 值 都 被 转换 成 较 低 精度 的 形式 。 这 样 做 会 使 程序 变 锡 CES, 
但 是 使 行为 变 得 更 加 可 预知 。 不 幸 的 是 ,我们 己 经 发 现 即 使 在 给 出 命令 行 选 项 的 情况 下 ，GCC S 
НАЕМА ИИМГЕ. РИШ, ЭЖ РТН Ж. 


code/datvfcomp.c 
1 void test2(int denom) 
2 d 
i doule r1; 
4 int tl; 
5 rl = recipidenom); /* Default: register, Forced store: memory */ 
6 tl = rl == l.0/(double) denom; /% Compares register or memory to register */ 
7 printfí("test2 ti: rl ЖЕ $&c- 1.2/10.0*n", ri, ti ? '=' : 717); 
8 } 


code/data/fcomp.c 
34 EAE" -02 ?选项 编译 时 ,tt 得 到 值 1 一 一 比较 是 在 两 个 寄存 器 值 之 间 进 行 的 。 当 带 “ -ffloat-store " 
选项 编译 时 ，tl 923780: 虽然 图 数 recip 调用 的 结果 被 写 和 存储器， 并 且 读 回 到 一 个 寄存 器 中 ， 然 
f, 1.0/(double) denom 计算 出 的 值 是 保存 在 寄存 器 中 的 。 总 地 来 说 ， 我 们 发 现 程序 中 看 起 来 
微小 的 改变 能 够 引起 这 些 测 试 以 不 可 预知 的 方式 成 功 或 者 失败 。 
男 外 一 种 选择 是 ， 我 们 能 够 通过 将 所 有 的 变量 声明 为 long double 类 型 ， 而 让 GCC 在 所 有 的 计 
算 中 都 使 用 扩展 精度 ， 如 下 面 的 代 稻 段 所 示 ， 


code/data/fcomp.c 
1 long dcuble recip líint denom) 


eturn l.0/(long double) denom: 


іп н бы [2 
— A — 


Б void test3iint denom) 

31 

8 ong doable rl, r3; 

9 nt ti, 12, ЕЗ; 

10 

11 rl = recip lidenom);  /*Stored m memory */ 

12 r2 = recip l(denom); ft Stored in register */ 

13 t] = rl == r2; ж Compares register to memory */ 
14 do notaingí)l: /* Forces register save to memory */ 
15 t2 = rl == r2: it Compares memory to memory */ 
16 ЕЗ = rl == l.0/(long double) denom; /* Compare memory to register */ 
1? printfi"Lest3 tl: rl $E %с- r2 %£Exn", 

18 (dcuble) ri, tl ? '=' : '!', [doublel r2); 

19 printfí("test3 L2: rl $E $c- rz $in", 

20 (dcuble) rl, t2 7 = ; *!', (асуре r2); 


21 printfií"test3 t3: rl £f $c= 1.0/10.0Xn", 
22 (double! rl, t2 ? '=' p '1'); 
23 | 


code/data/fcomp.c 


ANSI C 标准 允许 long double ЖЛІНІНІҢ, ДЖУРА З Т ЫП, ЖТ ДИН 
十 普通 的 double 类 型 , 然而 , 对 于 1A32 机 器 上 的 GCC 来 说 , 它 会 对 存储 器 数据 使 用 扩展 精度 格式 ， 
ЖИА ЫЗЫН СЕ. ИЕК ЕР ЕЛІНЕН ЗЕ ЕНІ) 的 范围 和 更 人 的 
THE. МИҒА ИТЕН ЕНЕҢ. PERE. DURER ЛЕ ЕНІ ДҮЙН. 
GCC 使 用 12 字 节 来 存储 long double 类 型 ， 增 如 六 50 免 的 存储 器 消耗 CR AR 0 个 字 节 已 经 足够 了 ， 
ЗЕН 12 宇 竹 能 状 得 更 好 的 存 慷 器 性 能 。，Linux 和 Windows HLB АЕ HER [s] 278875; t). (533 
存 器 则 存 情 器 之 辣 伟 送 这 些 更 长 的 数据 也 般 可 更 多 的 时 间 。 尽 管 如 此 ， 这 仍然 用 程序 想 要 得 到 最 准 
AURI OT 预知 结果 的 最 好 选择 。 

E: Ariane 5 一 一 浮 点 溢出 的 高 昂 代 价 

将 大 的 浮 点 数 转 换 成 整数 是 一 种 带 见 的 程序 错误 来 源 。1996 年 6 月 4 日 ， 对 于 Ariane S KEH 
初次 航行 来 说 , 这 样 一 个 错误 产生 了 突 难 性 的 后 果 , X AS Us 37 Ж. X ME ТЕН ҰЛЫН, 
解体 并 且 爆 炸 了 .火苗 上 载 有 价值 亿美 元 的 通信 工 星 。 

后 来 的 调查 [49] 亚 示 ， 控 制 惯性 导航 系统 的 计算 机 向 控制 引擎 喷嘴 的 计算 机 发 送 了 一 个 无 效 数 
据 ， 它 没有 发 送 飞 行 控制 信息 ， 而 是 送出 了 一 个 诊断 位 模式 ， 表 明 在 将 一 个 64 位 浮 点 数 转 换 成 16 
ӘЖЕҢ, PETH. 

3 B k mata q ААА k РЕ Ф, riska Ariane 4 КЎРА $ b T 54. ЖАЯ 
Ariane 4 ХЕ, fell dos eder T BEF k. MB SZ: ЖЕ ЖЖЖ ЖЕМИШ - 16 位 的 数 。 


TS X, ЖИП Ariane 5 火箭 的 系统 中 简单 地 重新 使 用 了 这 一 部 分 ， 而 没有 检查 它 所 基于 的 候 
it. 


ЖЫН 2.37 
МЖА x. 了 和 的 美 型 分 别 是 int float 和 double. 它们 的 值 是 任意 的 ， 除 了 上 和 d 都 不 能 
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等 于 +eo，-o 或 者 NaN。 对 于 下 面 每 个 C 表达 式 ， 要 么 证 明 它 总 是 为 真 со, КАЖ), ўж 
给 出 一 个 使 表达 式 不 为 真 的 值 ( 也 就 是 ， 求 值 为 0) 


А. x == (int)ifloat) x 
B. x == (intj]idouble] x 
C. f == [Iloat)[double) f 
D. d == (float) d 
E. f == -{-Ї) 
Е. 2/3 == 2/3.0 
G. id >= 6.0) |] ((d*2) < 0.0) 
Н. {9+1%-а4 == Í 
25 小 结 


计算 机 将 信息 编码 为 位 (比特 )， 通常 组 织 成 字 节 序列 。 有 不 同 的 编码 方式 用 来 表示 连 数 、 实 数 
和 字符 出 。 不 同 的 计算 机 模型 在 编码 数字 和 多 字 节 数据 申 的 字 节 顺序 上 使 用 不 同 钓 约定， 

C 语言 被 设计 成 包容 多 种 不 同 字 长 和 数字 编码 的 实现 。 虽然 电 端 机 器 逐渐 半 始 使 用 64 位 字 长 ， 
ВЕНАХ НЕЮ 32 位 字 长 。 人 密 数 机 器 对 辖 数 使 用 一 进 制 补 码 编码 ， 而 对 浮 点 数 使 用 
IEEE 纺 公 。 人 在 位 级 上 理解 这 些 编 妈 ， 并 且 理 解 算 术 运 算 的 数学 特性 ， 对 于 编写 能 在 全 部 数值 范围 | 
正确 运算 的 程序 来 说 ， 是 很 重要 的 ， 

C 语言 的 标 漂 规定 在 励 符号 和 有 符号 整数 之 间 进 行 强制 类 地 转换 了 时, 基本 的 位 模式 不 应 该 改变 。 
在 二 进 制 补 码 机 器 上 ， 对 于 - ve ERE, RETA AB PARE ТИ), 和 427, ЖАНЫ СЕБЕ 
式 的 强制 类 型 转换 会 得 到 许多 程序 员 无 法 预计 的 结果 ， 常 常 导致 程序 错误 。 

由 于 编 友 的 长 度 有 限 ， 计 算 机 运算 与 传统 整数 和 实数 运算 相 比 ， 具 有 非常 不 同 的 局 性 。 当 超出 
表示 范围 时 ， 有 耻 长度 能 够 引起 数值 涪 出 。 当 浮 点 数 非 常 接近 于 0.0， 从 而 转换 成 零 时 ， 浮 点 数 也 
E. 

ЖАКЕН, СЕТА DUE SURUR ЗВО ЕЛЕШЕ Е- - 些 特 殊 的 
ЕН. ІШ, нара, ЖАҚ vw 能 够 得 出 负数 。 但 是 ， 无 符号 数 和 ubt E S ТІҢ АК 
的 属性 。 这 就 允许 编 详 器 做 很 多 的 忧 化 例如， 用 {x<<3-xr 取 民 表达 式 m 时 ， 我 们 就 利用 了 结合 
性 、 区 换 性 和 分 配 性 ， 还 利用 了 移 位 和 乘 以 2 ҮНІНЕ. 

我 们 已 经 看 和 到 了 几 种 使 用 倍 级 运算 和 算术 运算 组 全 的 聪明 方法 。 例 如 ， 我 们 看 到 ， 使 用 一 进 制 
补 码 运 算 ， x+1 EHT -x 的 。 另 外 一 个 例子 ， 杞 设 我 们 想 要 一 -个 形 如 [0,…,0,1,…*,11 的 位 模式 ， 
H w — АЛ 0 иШ ЖИН k | 组 成 。 这些 位 模式 对 于 掩 码 运算 是 很 夺 用 的 。 这 种 模式 能 够 通过 C 
表达 起 {1<< 和 -1 生成， 利用 的 是 这 样 一 个 属性 ， 即 我 们 想 要 的 位 模式 的 数 慎 为 2-1。 人 例如， 表达 式 
(1<<8) -1 将 产生 位 模式 OFF., 

浮 点 表 小 通过 将 数字 编码 为 xx 2 的 形式 来 近似 地 表示 实数 。 最 常见 的 浮 点 表示 方式 是 由 IEEE 
btt 754 定义 的 。 它 提供 了 几 种 不 同和 的 精度 ， 最 常见 的 是 单 精度 (32 Лу) 和 双 精 度 (64 fu. IEEE 
UE nid DESEAN TERR Hee fl Мам. 

БИДЕ Ju RR) E AX S.S РД АО НАА ВЕ, IT EIE Gus LIEGE YER 
的 算术 属性 ， 比 如 结 会 性。 
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参考 文献 说 阴 

关于 蕊 的 参考 书 [40，32] 讨 论 了 不 同 的 数据 类 型 和 运算 的 属性 。C 标准 对 二 精确 的 宇 长 或 者 数 
宁 编 码 没 有 详细 的 定义 , 这些 细 上 节 是 故意 省 去 的 , 以 使 得 可 以 在 更 大 范围 的 不 同 机 器 SEXE C iB Б, 
已 经 有 几 本 书 [41，50] 给 了 人 语言 程序 员 一 些 建议 ， 和 警告 他 们 关于 溢出 、 隐 含 强 制 类 型 转换 到 泡 符 
号 数 ， 以 及 其 他 一 些 我 们 已 经 在 这 一 章 中 谈 总 到 的 陷 际 。 这 些 书 还 提供 了 对 变量 命名 、 编 码 风格 和 
代码 测试 的 有 痊 建 议 。 关 于 Java 的 书 【 我 们 推荐 Java 语言 的 创始 人 James Gosling 参与 编写 的 -本 
Pup 描述 了 Java 支持 的 数据 阁 式 和 算术 运算 。 

大 多数 关于 天 辑 设计 的 书 186，39] 者 有 关于 编码 和 算术 运算 的 章 В. REBRE J НАН. Ki: 
路 的 不 同方 式 。Overton Ё) J IEEE FABER 了 从 一 个 数字 应 用 程序 员 的 角度 出 发 的 关于 
格式 和 属性 的 详细 描述 。 
家 庭 作 业 

9 = 考验 概念 的 快速 习题 
ФФ = E39 5-15 分 钟 来 完成 ， 可 能 包括 编写 和 运行 程序 
99 = RELATEREN EA 

99699 = 出 要 一 个 或 者 两 个 星期 来 完成 的 实验 任务 

2.38 Ф 

(FARBE Ч Уу ТЫ АРАА НИДЕ Е, SEX] EHI show, bytes Е ( 3C fr show-bytes.c?. m 
定 这 些 机 器 使 用 的 字 TRU. 

2.39 Ф 

[ДЖ АН АМ] ХОН 221 show. bytes 的 代码 。 

2.40 Ф 

纺 写 程序 show short. show. long 和 show_double, 它 们 分 别 打印 类 型 为 short mt, long int ЖІ double 
HK CH ENEBG kas. ЖЕЛ ЯН LEIT. 

24199 

编写 过 程 is_litle_endian， 当 在 小 端 法 机 器 上 编译 和 运行 时 返回 1， 在 大 端 法 机 器 土 编译 运行 时 
加 旭 呈 0。 这 个 程序 应 该 可 以 运行 在 任何 机 器 上， 无 论 机 器 的 字 长 是 多 少 。 

24299 

йз САКА, ТЕТ. H x 的 最 低 有 效 字 节 和 y ha ТИЙ. d THO 
x ZOXS9ABCDEF 和 у= 0x76543210, 548380 Ox765432EF. 

2.43 %% 

ПАЛМ АЕ, БН C W А, АТАНА ker FE 1， 而 在 其 他 情况 下 得 
到 0。 MERENAH ІЛЕ В К. RE x EX 

A КАИ Д-Р 1. 

B. x Н (A SET 0. 

C. x Hee Ce REM 1. 
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D. x BURCH Cp ИП ИМ ЯА 0. 

244999 

编写 Р int shifts are. агиһтейс(), f& x A 88 e ЕНЕ ЖАЛЫНДА 上 运行 时 
生成 1， 而 其 他 情况 下 生成 0。 你 的 代 色 应 该 可 以 运行 在 任何 字 长 的 机 器 上 。 存 几 种 机 器 上 测试 你 的 
代码 ， 丹 写 并 测试 过 程 unsigned_shifts_are_arithtmmetic0， 该 过 程 确定 对 大 符号 整 娄 使 用 的 稀 位 形式 ， 

2,45 ФФ 

你 有 -个 任务 ， 要 编写 AHE mt әле ds 320， 当 在 一 个 int R32 ЫНЫ АЯТЫ, 38 
序 产生 1， 和 而 对 于 共 他 情况 则 后 成 0。 下面 是 开始 时 的 符 试 : 

1 /* The following code does not run properly on some machines */ 

2 int bad int size,» is 32() 

3 | 

4 /* Set most significant hit (msb) of 32-bit machine */ 

^ int set msb = 1 << 31; 

6 /* Shift past msb of 32-bit word */ 

f in- beyond msb = 1 «« 32; 
8 


9 /* set msb is nonzero when word size >= 32 

10 bevond тп is zero when word size <= 32 */ 
11 return set msb && !beyond msb; 

12 1 


不 过 ， 当 在 SUN SPARC 这 样 的 32 位 机 器 上 编 详 并 运行 时 ， 这 个 过 程 返 回 的 却 是 0。 上 下面 的 纺 
译 器 信息 给 了 我 们 :个 问题 的 指示 


warning: left shift count >= width of type 

A. EPRE TERES GE C 的 标准 ? 

B. ERIRE, REPE k im 至 少 为 32 位 的 任何 机 器 上 都 能 正确 地 运行 。 

C. 修改 代码 ， 使 得 它 在 m 至 少 为 16 位 的 任何 机 器 上 都 能 正 多 地 运行 。 

2.46 Ф 

你 刚刚 开始 为 一 家 公司 工作 ， 他 们 要 实现 -组 过 程 来 操作 一 个 数据 结构 ， 要 将 4 个 有 符号 字 节 
封装 成 一 个 32 位 unsigned。 在 字 中 的 字 节 是 从 0 (Eki SF h) 编号 到 3 (最 高 有 效 字 节 )。 你 被 
分 配 的 任 劳 是 ;为 使 用 二 进 制 补 码 运算 和 算术 石 移 的 机 器 编写 一 个 县 有 如 下 原型 的 函数 ， 


/* Declaration of data type wiere 4 bytes are packed 
into an unsigned */ 
typedef unsigned packed t; 


/* Extract byte from word. Return as signed integer */ 
int xbyteí(packec L word, int oytenum); 


tabe. АН НЕЛЕ ВО У, BEERS ERA 32 位 mt. 
你 的 前 任 〈 因 为 水 平 不 够 高 而 被 解雇 了 ) 编写 了 下 向 的 代码 : 


/* Failed attempt at xbyte */ 
int xbytei(packed t word, int bytenum) 
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re lrt 
(word >> [уеп << 31) & UÜxFF:; 


А. 这 段 代 码 钳 企 哪里 ? 
В. 给 出 函数 的 正确 实现 ， 只 使 用 左右 称 位 和 一 个 减法 ， 


2.47 % 

填写 下 列表 格 ， 按 照 图 2208045, AED DX) EORR (或 取 反 ) 和 加 AR. Wigs 
"ЕЛИМ, 

z 





248 $ $ 

请 说 明 先 减 1 然后 取 补 等 价 于 先 取 补 然后 再 加 1。 也 就 是 说 , 对 于 任意 有 符号 值 X С ЖАК x. 
Oel 和 (x-D) 产 生 可 样 的 结果 。 你 的 推导 依 荐 于 二 进 制 补 码 加 法 的 什么 数学 属性 ? 

245%%% 

慨 设 我 们 想 娄 计算 x y 的 完全 2w 9 бл, EF, x 和 y 都 是 无 符号 数 ， 并 日 运 行 的 机 器 .上 数据 
类 型 unsigned JE w 们 的。 乘积 的 低 w 位 能 够 用 表达 式 x*y 计算 ， 所以， 我 们 只 需要 ”个 具有 下 列 
原型 的 阴 数 

unsigned in- unsigned high prodíunsigned x, unsigned y); 

ЖАКИ НАЛЫ ИЕ xy 的 高 w 位 。 

我 们 使 用 TRA F E A pE R А, 

int signed nigh prodlint x, int v); 

它 计算 在 x* 和 y 是 二 进 制 补 码 形式 的 情况 下 ， xy 的 高 w 位 。 编 号 代码 调用 这 个 过 程 ， 以 实现 
用 万 符号 数 为 参数 的 清 数 。 验 证 你 的 解答 的 JE 确 性 。 

om. 看 看 等 式 2.16 FEST, FUSER x y 和 无 符号 乘积 xy 之 问 的 关系 

2,50 %% 

假设 我 们 有 “个 任务 : En - 段 代 码 ， 用 来 将 整数 变量 ЖИЛЫ НТК. STEAUY 
举 ， 我 们 想 具 使 用 +、- 、<< 等 运算 ， 对 于 直列 天 的 值 ， 写 出 执行 乘法 运算 的 C 表达 式 ， 每 个 表达 


式 中 最 多 使 用 3 个 运 血 ， 
А. K-5; 
B. K-9; 


C. K=14: 
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D. K=-56: 


25199 

ЕМЕШ P АЮ C 3А, Фа SORTES a REM ku. 假设 一 个 w 位 的 数据 类 型 。 你 
的 代 个 可 以 包含 对 驳 数 j 和 素 的 引用 ， 它 们 分 别 表 水 关 和 外 的 值 ， 但 是 不 能 使 用 表示 w 的 参数 。 

А. 1^0, 

B. 0" J'y, 

2,52 ФФ 

假设 我 们 把 w 位 的 字 中 的 字 节 按照 外 0 5 最 低 有 效 字 节 ) 到 08-1 RAA ATID 的 顺序 编号 。 
БШ ТЕС 函数 的 代码 ， 这 段 代 人 码 将 返回 一 个 无 罕 导 值 ， 其 中 参数 x 的 学 节 P.P r b MN]: 

unsigned replace byte (unsigned x, int i, unsicned char Б); 

下 面 是 一 些 示 酌 ， 展 示 了 测 数 会 如 何 上 作 ; 


replace_byte()x12345678, 2, ПхАВ) --» Oxl2AB5578 
replace byte(Jgx12345678, 0, ÜxAB] --> 0х123456АВ 


2534999 

填写 下 列 C 函数 的 代码 。 项 数 (d 使 用 算术 石 移 СН хета 给 出 ) CEBUEDE SCORES, КИЕ Е 
其 他 不 包括 直 移 或 者 除法 的 运算 。 通 数 sra 使 用 逻辑 右 移 〈 由 值 xsrl 给 出 ) 来 执行 算术 右 移 ， 紧 中 着 
临 是 其 他 不 包括 右 移 或 者 除法 的 运算 ， 你 可 以 航 设 i 训 是 委 但 长 的 ， 移 位 最大 的 家 值 范 力 是 0—31. 

unsigned srlíunsigned x, int К) 

I 


/* Perform shift arithmetically */ 
unsigned xsra = lint) X >> К; 


/ж ,,. %/ 
| 
int sraí(int x, int k) 
{ 
/* Periorm shift logically */ 


int xsrl = (unsigned) х >> К; 
/# ... */ 

} 

254 Ф 


我 们 在 一 个 int 类 型 值 为 32 位 的 机 器 上 运行 程序 。 这 些 值 以 二 进 制 补 码 表示 ， 而 用 它 们 都 是 算 
RAW. unsigned 类 型 的 值 也 是 32 位 的 。 
我 们 产生 任意 信 x 和 y， 并 有 昌 把 它们 转换 成 其 他 无 符号 数 ， 


/* Create some arbitrary values */ 
int x = randomií); 

int v = randomi); 

/* Convert to unsigned */ 

unsigned ux = (unsigned! x; 
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unsigned uy < (ursigned, у; 


AFARA C RAR КЕННЕН ЕЛІ. WECKER L NZ dE 
数学 原型 。 否 则 ， 列 举 出 一 个 使 它 为 0 的 参数 示例 . 


А. [x<y) == {-Х>-у} 

B. [{х+у)<<4) + y-x == 17%у-15%х 
С.7х-7у == 7іх«у) 

D. (iint! tux-uy) == - {у-Х) 


E. іх >> 1) << 1) <= x 
255499 
FERRA, cede oe RIBEmüvyyyyyy МӘЛЕ МИН, Bh yd E 
k Az. БІЗІ, „ИЕ 001010101. = 0D, 而 的 一 进 制 表示 是 0.001100110011 --. 
(у = 0011). 
A. 设 Y=B2Ui(y)， 也 就 是 说 ， 这 个 数 具 有 二 进 制 表 水 y。 对 于 无 穷 串 表 示 的 值 ， 给 出 н У 
A k B5 A A. 
Won. ыы ОЖ ЫЛ soe kie. 
В. 对 于 十 记 的 ? 值 ， 串 的 数值 是 多 少 ? 
(а) 001 
(b) 1001 
(c) 000111 
256 Ф 
АУ РРА, А ЕАК Za - J pa R АТАТ EAER Б 
Еу Ru 退回 一 个 元 符 号 RART. RAF sre PER 2 ФЕН ОЈ И НИИ NaN, 
40 和 -0 被 认为 是 相等 的 ， 
int float geíftloat x, float y! 
l 


unsigned ux = t2u(x); 
unsigned uy = ёй. (у); 


/* Get the sign bita %; 
unsigned &x - ux >> 31; 
unsigned sy = uy >> 31; 


/* Give an expression using only ux, цу, Sx, and sv */ 
return /* ,,, *j/ 


* 
ғ 


} 
2579 


SRL ЛАЙ А. НАШЕЙ n 0, РР, SERRE ЖИК М. ЭИ f N 
值 YY 的 公式 。 为 外 .请 描述 其 位 表示 ， 
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A. Ж 5.0. 
B. ЙЕ% ЖЕНИШ Ву А АР Я, 
C, 最 小 的 规格 化 数 的 倒数 ， 


2.58 Ф 

与 Intel ВКА ХЕ “ГЕН” БАЖА. Ph K НВ S0 位 字 长 ， 被 分 成 1 4 fi 
号 位 、15 个 指数 位 (k=15)、1 个 单独 的 整数 位 和 63 ВЕУ (л=63). ЗУ ДЕ IEEE 浮 点 表示 中 
隐 傅 位 的 显 式 拷贝 。 也 研 是 说 ， 对 于 标准 值 它 等 于 |， 对 于 不 标准 值 它 等 于 0。 填写 下 表 ， 给 出 这 种 
格式 中 的 _ 些 “有 趣 的 ”数字 的 近似值 。 


ma — | 
Das | 0| 
ЕТІІТІСІН |] — — 





2.59 Ф 

考虑 一 个 基于 IEEE 浮 点 格式 的 16 WEG. UERÉAITRSU.T7TIBEN OBS 
个 小 数位 {n=8)。 指 数 偏 置 量 是 2 -1= 63, 

对 于 每 个 给 定 的 数 ， 填 写 下 表 ， 其 中 ， 每 一 列 具 有 如 下 指示 说 明 ， 

Hex， 描 述 编码 形式 的 四 个 十 六 进 制 数字 。 


M， 有 效 数 的 值 。 这 应 该 是 一 个 形 如 x 或 寺 的 数 ， 其 中 是 一 个 惧 数 ， 而 》 是 2939308, DI 


i: 0, $7 &i——. 
64 256 
E: HAHAKE. 
V: Pr Ev Bu ЧЕ. WH x 或 者 +x 表示 ， 其 中 x 和 和 5z 都 是 整数 ， 


举 一 个 例子 ， 为 了 表示 数 二， 我 们 有 з= 0， 林 = 二 和 E=1。 因 此 我 们 的 笋 的 指数 域 为 0x40 (上 


ЖЕҢНІҢ 3+]=64)， 有 效 数 域 为 0xC0 (二进制 11000000,}， 得 到 一 个 十 六 进 制 的 表示 40С0. 
标记 为 “-” 的 条 日 不 用 上 填写。 
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2.50€ 

我 们 在 一 个 inc 类 型 为 32 P£ ЫН Жл КИЛЕН Eie fT TRE. float 类 型 的 值 使 用 32 位 IEEE 
格式 ， 而 double 类 型 的 值 使 用 64 7 ТЕБЕ 格式 。 

A1 EBENE: у с, ЯНЖЕЛЕСЕН double: 


/% Creale some arbitrary values */ 
int x = randomí); 

int y = randam(í]; 

int u = random); 

/* Convert to double */ 

double dx = (double! x; 

double dy = (double) ү; 

double dz = (double) z; 


对 于 下 刚刚 每 个 С 表达 式 ， 你 要 指出 表达 式 是 罕 总 是 为 1. ШЖ 1, SACHE 
原理 否则， 列举 出 使 它 为 0 的 参数 的 例子 。 请 注意 ， 不 能 使 用 IA32 机 器 运行 GCC 来 测试 你 的 答 
案 ， 央 为 对 于 float 和 double， 它 使 用 的 都 是 80 位 的 扩展 精度 表示 。 

А, (double) (float) x == dx 

B.dx + dy == (double) (vex) 

C.dx « dy + dz -- dz + dy + dx 

D.dx * dy * dz -- dz * dy * dx 

E.dx / dx -- dv / dy 


2,51% 
你 被 分 配 了 一 个 任务 , Еа P CAM IN 于 的 浮 点 表示 。 你 意识 到 完成 这 个 的 最 好 方法 
是 直接 创建 结果 的 IEEE 单 精度 表示 。 当 x ҚАМ, 你 的 程序 将 返回 0.0。 当 x 太 大 时 , 它 会 返回 4eo。 
填写 卜 列 代码 的 空白 部 分 ， 以 计算 出 正确 的 结果 。 候 设 函 数 u2f 返回 的 浮 点 值 与 它 的 无 符号 参数 有 
相同 的 位 表 帮 :。 
i oat fpwr?1int x) 
{ 
/* Result exponent and significand */ 
unsigned exp, sig; 
unsigned u; 


1f (x < ; /* Too small. Return 0.0 */ 
exp = 
sig = ; 

) else if [x < ) /* Denormalized result */ 
exp < — 
gig - 


} else if (x < ) /* Normalized result. */ 


— r 
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) else { /* Too big. Return «oo */ 


XH 

= 
е 

H 


/* Раск exp and sig into 12 bits */ 
u = exp << 23 | sig; 

/* Return as float */ 

return u2fíu)]; 


1 

262% 

大 约 公元 前 250 年 ， 币 胶 数学 家 阿 基 米 德 证 明了 -<r< 邱 ， 如 果 当 时 他 有 一 台 计 算 机 和 标准 
库 <math.h>， 他 就 能 够 确定 x 的 单 精 度 浮 点 近似 值 的 十 六 进 制 表示 为 0k40490FDB 。 当 然 ， 所 有 的 这 


些 都 只 是 还 似 值 ， 因 为 r 椒 是 有 理 数 。 
А.Х ИН АН ҒЫ RES? 


B. ERE 提示 ， 参见 练习 题 2.55， 
C. 这 随 个 g 的 近似 信 从 哪 一 位 《相对 于 二 进 制 小 数 点 ) 开始 不 同 的 ? 
Ak >] Re 


5 5188 2.1 答案 
- - 卫 我 们 开始 查看 机 器 级 程序 ， 理 解 十 六 进 制 和 二 进 制 格式 的 关系 将 是 很 重要 的 。 虽 然 本 书 中 
介绍 了 完成 这 些 转换 的 方法 ， 但 是 秽 点 练习 能 够 让 你 更 加 熟练 。 
和 .将 0x8&F7A93 转 换 成 二 进 制 ， 
十 六 进 制 8 F 1 А 0 3 
一 进 制 1000 lt о 1010 1001 0011 
B. 将 二 进 制 101]011110011100 转 换 成 十 六 进 制 ， 
НІ 101] 0111 1001 1100 


ToS B 7 9 C 
C. 将 0xC4E5D 转换 成 二 进 制 ， 
ToS C 4 E 5 D 


二 进 制 — 1100 0100 1110 0101 1101 
D. 将 二 进 制 1101011011011111100110 转 换 成 十 六 进 制 ; 

二 进 制 11 0101 0111 1110 0110 

十 六 进 制 3 5 7 E 6 
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练习 题 2.2 E 
世人 个 问题 络 你 一 个 机 会 思考 2 的 时 和 它们 的 二 六 进 制 表示 。 


J 


бх1бС 
M exa 





练习 题 2.3 答案 
这 个 问题 给 你 一 个 机 会 试 着 对 一 些小 的 数 在 十 六 进 制 和 十 进 制 表示 之 间 进 行 转换 。 对 十 较 大 的 
烙 ， 使 用 计算 器 或 者 转换 程序 会 更 加 方 恒 和 吕 洁 E, 


СИИИ 
mass [шш [т _ 



















90 

, 7 
ra 

C 

14 * 167223] T 
10 * 1847-1687 1010 0111 


练习 题 2.4 答案 

当 开 始 调试 机 器 组 程序 时 ， 将 发 现在 许多 情况 中 ， 一 些 简单 的 十 六 进 制 运算 是 很 有 用 的 。 可 以 
总 是 把 数 转换 成 十 进 制 ， 完 成 运算 ， 再 把 它们 转换 同 来 ， 人 得 是 能 够 自 接 用 | 六 进 制 上 作 更 加 有 效 ， 
Ta LL ge Se SEHE SE a. 

А. 0х502с+ 0х8 = 0х5034. 8 加 上 十 六 进 制 < 得 到 4 并 且 进 售 1. 

В. 0х502с-0х30 = 0x4ffec。 在 第 二 个 数位 ，2 减 去 3 要 求 从 第 二 位 借 1。 因 为 第 三 位 是 0， 所 所 

我 们 必须 从 第 四 位 借 位 。 

C. 0х502с+64 = 0x506c. 十进制 64 (250 等 于 十 六 进 制 0x40。 

D. 0x51da-0x502e = 0xae。 上 六 进 制 数 a (十 进 制 10) RETARA e (十 进 制 12)， 我 们 从 


3 
5 

10 + 16+12=172 | 1010 1100 
А 


FH. 
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第 一 位 借 16. 33H ABS e СОҒЫ 14)。 在 第 一 个 数位 ， 我 们 现在 用 十 六 进 制 ec {十 
进 制 12) 5252, ШЙ ЛЫ а CT R| 10). 


练习 题 2.5 答案 

这 个 问题 测试 你 对 数据 的 字 节 表 示 积 两 种 不 同 字 节 顺序 的 理解 。 
A. Уф: 78 Хн: 12 

B. 小 端 法 : 78 56 AXE: 12 34 


C. 小 端 法 ; 78 56 34 КЕ: 12 34 56 
HÆ- - F. show_bytes 列举 了 一 系列 守节 ， 从 低位 地 址 的 字 衣 开始 ， 然 后 逐 - - 列 出 高 位 地 址 的 
在 一 个 小 并 法 地 器 上 ， 它 将 按照 从 最 低 有 效 字 广 到 最 高 有 效 字 季 的 是 序 列 出 学 节 。 在 一 个 大 


端 法 机 器 上 ， 它 将 按照 从 最 高 有 效 子 节 到 最 低 有 效 字 节 的 顺序 列 出 字 节 。 


A 


练习 题 2 6 答案 
这 个 问题 又 是 -- 个 练习 从 十 六 进 制 到 十 进 制 转 换 的 机 会 。 同 时 它 带 给 你 对 整数 和 浮 点 颠 示 的 思 


。 我 们 将 在 本 章 后 而 更 加 详细 地 研究 这 些 表示 。 


A. AE BERAR S. RIARTE 0: 


0 0 3 5 4 3 2 1 
00000000001101010100001190100001 


k * * cose k f ғи A 6 КАК ККЕ x 


4 A 5 5 с c 8 4 
01001010010101010000110010000100 


ВЕНАҒА 57 217, EDES—TS2 个 苞 配 位 的 序列 ， 

C. 我 们 发 现 除 了 最 请 位 1, 整数 的 所 有 位 都 杠 入 在 泽 点 数 中 。 这 正好 是 书 中 示人 钢 的 情况 。 男 外 
浮 点 数 有 一 些 韭 零 的 高 位 不 与 整数 中 的 高 位 相 匹 配 。 

练习 题 2.7 答案 

TERES 41 42 43 44 45 46。 回 想 - F, ERAR strlen 不 计算 终止 的 室 字 符 ， 所 以 show, bytes 


АЯШ Єй UFU. 


练习 题 2.8 答案 
这 个 题 日 是 一 个 帮助 你 更 可 熟悉 布尔 运算 的 练习 。 


[01101001] 
[01010101] 


(100101101 
[10101010] 
[01000001] 


01111101) 
(00111190) 
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练习 题 2.9 答案 
这 个 避 题 举例 说 明了 布尔 代数 竺 样 被 用 来 描述 和 解释 现实 宪 异 的 系统 。 我 们 能 够 看 到 这 个 颜色 
代数 由 使 用 长 度 为 3 的 亿 回 量 上 的 布尔 代数 屋 ЖЕН. 
A. 颜色 的 取 补 是 通过 对 及 G fl B 的 值 取 补 得 到 的 。 由 此 ， 我 们 亲 以 看 出 ， 百 色 是 黑色 的 补 ， 
黄色 是 蓝 刍 的 补 ， 红 紫色 是 绿色 的 补 ， 蓝 绿色 是 红色 的 补 ， 
B. Ef 0, ШЕВ 1. 
C. 我们 基于 颜色 的 他 网 量 表示 来 进行 布尔 运算 。 据 此 ， 我 们 得 到 以 下 结果 : 
ЖҮР, (001) | 红色 《〈100) = £EX (101) 
HRE (101) & 蓝 绿色 (011) = 蓝 色 (00D 
绿色 (010) AB (111) = ИА (101) 
练习 题 230 答案 
这 个 程序 依赖 于 EXCLUSIVE-OR 是 可 交换 的 和 品 结 合 的 这 一 事实 ， 以 及 对 于 任意 的 a H a 
а=). ЕЖ S ЫП ЕН ЗІНЕ ЗЕН x Rl y 相等 时 〈 也 就 是 说 ， 岗 个 指针 指向 同一 个 忆 置 时 )， 
ЖАНЕ 1 92 E. 





练习 题 2.11 答案 

观察 下 列表 达 式 ; 

A. x l'OxFF 

B. x ^OxFF 

C. x & "ÜxFF 

底 些 表达 式 是 在 执行 低级 位 运算 中 经 常 发 现 的 典型 类 型 。 表 达 式 "0xFE В — ЧЕ, ЕВУ 8 
个 叙 低 位 等 于 0， 而 其 余 芍 位 为 1。 可 以 规 察 和 到， 这 些 掩 码 的 产生 是 和 字 长 无 美的 。 而 相 比 之 下 , 表 
达 式 DxFFFFFF00 只 能 工作 在 32 位 的 机 器 十 ， 

练习 题 2.12 答案 

JC B] R78 Bh f EET SCR S E PLZ [REX RS PED E; 

/* Bit Set */ 

int bisíint x, int m) 

{ 

int result = x | m; 


return result; 


] 
/* Bit Clear */ 
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int bicí(irt x, int m) 
{ 

int result = x & "m; 
return result; 


} 
很 容易 看 出 ，bis kft КИК OR— m x 中 或 者 m 中 的 这 一 位 置 位 了 ， 那么 z 中 的 这 一 位 
就 置 位 。 
bic 运算 更 加 微妙 一 些 。 我们 想 要 设置 z 的 -位 为 0， 如 果 羡 的 相应 何等 于 1。 若 我 们 对 这 个 掩 
码 取 补 得 到 m, JZ RK a ASI R z 的 一 性 为 0， 如 果皮 补 后 的 撞 码 的 相应 位 等 于 D。 我 们 能 
ЕН AND 运算 来 实现 这 一 点 。 
练习 题 2.13 答案 
这 个 问题 突出 说 时 了 位 级 布尔 运算 和 C 语 言 中 的 逻辑 运算 之 间 的 关系 ， 
表达 式 霄 表达 式 


x | y OXF? 0x01 












^ - 





x | 

练习 题 2.14 答案 

表达 式 是 1 (x Ay). 

也 就 是 ， 当 且 促 当 x 的 每 一 位 和 y 相 庶 的 餐 一 不 匹配 时 ，xA y 等 于 零 。 然 后 ， 我 们 利用 ! БІЛІНЕ 
来 判定 一 个 字 是 否 包 含 任何 非 零 位 。 

没有 任何 实际 的 理由 要 去 司 用 这 个 表达 式 ， 而 不 简单 地 写成 x ==y， 但 蚌 它 说 明了 位 级 运算 和 
好 辑 运算 之 间 的 --- 些 细微 差别 。 

练习 题 2.15 答案 

这 个 问题 是 一 个 帮助 你 理解 不 同 移 位 运算 的 练习 。 


(228) ИЖ) 
[10101000] xÜAB [00010101] 0x15 


d RE 216 ЖЖ 
一 般 而 言 ， 研 究 非常 小 的 宝 长 的 例 了 是 理解 计算 机 运算 的 非常 好 的 方法 。 
无 符号 值 对 应 于 图 2.1 中 的 值 。 对 于 二 进 制 补 码 值 ， 十 六 进 制 数字 0 一 7 的 最 高 有 效 位 为 0， 得 




















94 42% 


到 非 负 值 ， 然 前 十 六 进 制 数 子 8~F 的 最 高 有 效 位 为 }， 得 到 -个 为 负 的 值 。 


十 六 进 制 二 进 制 


25.22-12 





э%ь2%+2!+2°— 15 - 1 31, N 


练习 题 2.17 答案 

xF 32 НА, 任何 值 如 果 由 8 个 十 六 进 制 数字 组 成 的 , m óW E T Ce A: 8-12 IB. 
事 么 这 个 数值 就 居 一 个 负数。 看 到 数字 以 串 í 开 尖 是 根 普 遍 的 事情 ， 因 为 偶数 的 起 娘 位 全 为 1. Á 
过 , VU BUE r Т. 例如, 数 0х8048307 仅仅 有 ?了 个 数字 ,把 起 始 位 填 入 0, 从 而 得 到 0x080483b7， 
这 是 - МЕН. 


40483b7: Бі ес 84 01 00 00 sub 50х184,%є<р А, 188 
8048350: 53 pusi %ерх 

8a04Bibe: Bb 55 08 mov ÜxB(&ebp),.&edx B. 8 
80483cl: ВЕ 5d бс mov üxcí(*ebp),*ebx C. 12 
80483с4; 86 4d 10 möv 0x19 {ері ,Secw D, 16 
50483с7: Bb H5 94 fe ff If mov OÜxffiffe3i(tebp),*eax E. -366 
Sü0dB83icd: 01 ch add %есх,%ерх 

BO483cF: 03 42 10 add üxlÜ0í*edx),$*eax F. 16 
8048332: 89 B5 ай fe ff rf mov €eax,Ü0xfffffea0(&ebp) G. -352 
8048338: 8b 85 10 ff fË ff mov Oxfffffflü(&ebp!),eax H, -340 
80483д4е: 89 42 le mov €$eax,ü0xlcí*edx) I. 28 
aDAB3el: 89 За Tc ft ft Ff mov €&ebx,0xtfffíf7ci(tebp) J. -132 
80483e7: Bh 42 18 mov Uxl8itedx!,&eax К. 24 
练习 题 2.18 答案 


BJ AC E K B. NE NU 和 U2T 是 非常 奇特 的 。 理 和 解 它们 的 行为 非常 重要 。 
解 从 这 个 问题 ， 我 们 是 根据 二 进 制 补 码 的 值 ， 重 新 排列 练习 题 2.16 的 解答 中 的 行 ， 热 后 列 出 无 
符号 值 作为 咀 数 应 用 的 结果 ， 我 们 展示 出 十 具 进 制 值 ， 以 合 这 个 进程 更 加 具体 ， 
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练习 题 2.19 答案 

这 个 练习 题 测试 你 对 等 式 2.4 的 理解 。 

对 于 开始 的 网 个 条 日 ，x 的 值 是 负 的 ， 并 县 T2U 0) 2x 2°. ET I К Л ЖЕН. x 的 值 是 非 
负 的 ， 并 且 TILO = x 

练习 题 2.20 答案 

这 个 向 题 护 强 你 对 二 进 制 补 码 和 亡 符 号 表示 之 间 关 系 的 理解 ， 以 及 村 C 语音 升级 规则 
(promotion rule) 的 影响 的 理解 。 回想 一 下 ，TMinyy 是 ~2147483648， 江 日 将 它 强制 类 型 转换 为 万 笠 
号 数 后 ， 安 成 了 2147483648。 男 外 ， 如 果 有 性 一 -个 运算 数 是 无 符号 的 ， 邦 么 在 比较 之 有 果 ， 男 一 个 运 
算数 会 被 强制 类 型 园 模 为 尤 罕 号 教 。 


A 






1 
[esmes aes neue |ва | 0 


练习 是 2.21 答案 

ERAR АҚАН АЕ “ОЛЕН”, 用 来 从 多 个 位 域 打 包 成 的 一 个 字 中 提取 值 。 
它们 利用 不 同 移 位 志 算 的 零 填 充 和 符号 扩展 属性 。 请 注意 强制 类 型 转换 和 移 位 适 算 的 腑 序 。 在 funl 
中 ， 移 位 是 在 无 等 与 word КЖ ТЕ. НЕРУ. 看 fun2 中 ， 移 位 是 在 把 word 强制 类 型 转换 
为 int 之 后 进行 的 ， 因 此 是 算术 移 位 。 





[owe 


127 127 





B. AY funi 从 参数 的 低 8 位 中 提取 -个 值 ， 得 到 范围 0 一 255 2 0 — Ж. РА fun2 
也 从 这 个 参数 的 低 8 位 中 提取 -个 值 , 但 是 它 还 要 执行 符号 扩展 。 结 果 将 是 介 于 -128 一 127 之 间 
的 一 个 数 。 


练 可 题 2.22 答案 


对 于 无 行 号 数 ， 截 断 约 影响 是 相当 直观 的 ， 但 基 对 于 一 进 制 补 码 数 就 不 是 这 样 的 了 。 这 个 练习 
让 您 使用 非常 小 的 字 长 来 研究 它 的 属性 。 


正如 等 式 2.7 所 描述 的 ， 这 种 截断 雹 符号 数值 的 结果 就 是 发 现 它们 的 模 8 余 教 。 截 断 有 符号 数 


9б %2% 


的 结果 要 更 复杂 一 些 。 根 据 等 式 2.8， 我 们 首先 计算 这 个 参数 模 8 后 的 余数 ， 对 于 参数 0 一 7， 这 将 
得 出 值 0~7, 对 于 参数 -8 一 -1 也 是 一 样 ,然后 我 们 对 这 些 余 数 应 用 函数 027, 得 出 两 个 0~3 ЖІ-4-- 
1 序列 的 反复 。 





练习 题 2.23 答案 

这 个 问题 是 设计 来 涪 明 从 有 符号 数 旬 无 符号 数 的 隐 式 强制 类 型 转换 是 多 么 容易 引起 错误 的 啊 。 
将 参数 length 作为 - 个 无 符号 数 来 传递 看 上 去 是 件 相 当 自 然 的 事情 ， 因 为 没有 人 会 想到 使 用 一 个 值 
为 负数 的 length. EIFE <= length-1 看 上 去 也 很 自然 。 但 是 把 这 两 点 组 合 到 - -起 ， 将 产后 意 想 
ZI EE ! 

因为 参数 length XE JC RES. 计算 0-1 将 使 几 亏 符 与 运算 来 进行 ， 这 相当 于 模 数 加 法 。 上 站 果 是 
UMax,; С® йл 32 ҚА). «КЕННЕН ЖЕЗ НЫ, ПЕНЕН 32 位 数 都 是 小 于 或 者 
等 于 UMax3; 的 ， 所 以 这 个 比较 运算 将 一 直 持续 下 去 ! 因此， 代码 将 试图 访问 数组 a 的 无 效 元 素 。 

有 丙种 方法 可 以 收 正 这 段 代 码 ， 其 一 是 将 length 声明 为 int 类 型， 其 二 是 将 for 循环 的 测试 条 件 
改 为 1< length. 

练习 是 2.24 答案 

这 着 习题 是 对 算 本 模 16 的 简单 示范 ,最 容易 的 解决 方法 是 将 十 六 进 制 模式 转换 成 它 的 雹 符号 十 
МЕНЕ. AFEN X (A. ЖАП (-0 хр = 16。 然 后 ， 我 们 就 可 以 将 到 补 了 的 值 转换 吓 十 六 
Ж. 





ЖЫШ 2.25 答案 
i18 2] 848 — T AR RUE Y ВЕНАМА РЕ 3] 
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о (lo оо 


练习 题 2.26 答案 

这 个 问题 使 用 非常 小 的 字 长 来 帮助 你 理解 二 进 制 补 码 的 非 (negation), 

对 于 m=4， 我 们 有 TMin, =-8。 因 此 -8 是 它 自己 的 加 法 赣 元 ， 而 其 他 数值 是 通过 整数 非 反 来 取 
非 的 。 

















对 十 无 符号 数 非 ， 位 的 模式 是 相同 的 。 
练习 题 2.27 答案 
这 道 习题 是 一 个 确保 你 理解 了 二 进 制 补 码 滋 法 的 练习 。 


Xp SN 6 [001100] 
二 进 制 补 码 112100] 


ЕЖ 
进 制 补 码 


Aq o 
ЖЕЕ 





练习 题 2.28 答案 
在 第 3 章 中 ， 我 们 将 看 到 银 多 实际 的 leal 指令 的 例子 。 这 个 指令 被 提供 用 来 支持 指针 运算 ， 但 
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是 C 编 详 器 经 常用 它 来 作为 执行 小 常数 乘法 的 “种 方法 。 
对 丁 上 的 每 一 个 值 ， 我 们 可 以 计算 出 2 的 倍数 ， 2 СЪ О) 和 2*+ 1 C5 b 为 a}y。 寺 此 我 们 
能 踪 计 算出 倍数 为 1,2,3,4,5,8 和 9， 
练习 题 2.29 答案 
我 们 发 现 兰 人 们 直接 用 汇编 代码 做 这 个 练习 时 是 有 困难 的 。 但 当 把 它 放 入 到 optarith 所 示 的 形 
式 中 ， 癌 题 就 变 得 更 加 清 断 明 卫 了。 
我 们 叮 以 看 到 M E 15; x*M EEN (х<<4)-х ЖИ. 
我 们 可 以 看 到 N E 4; hy 是 负数 时 ， 加 上 偏 置 量 3， 并 日 右 称 2 位 ， 
练习 题 2.30 ЖЖ 
XT “С 的 迷 题 ”清楚 地 告诉 程序 员 必 须 理解 计算 机 运算 的 属性 。 
A, (x >= 0) II ((25x) < Q). 
fx. x3 T-2147483648 (TMina), WA, efi Ж 2*x EF 0. 
B.(x & 7) != 7 ll (x««30 < 0). 
Б. M KG &T!7Xx ^ 3x90k809(879 0, ЖАВИ ЕТІ. "A ЗО 位 时 ， 这 
个 位 将 变 成 位 号 位 。 
C. (x * x) >= 0. 
fx. 73x79 65535 (OxFFFF) М, x*x 为 -13107] {OxFFFE0001)。 
D.x «0l -x <=. 
KR. Add. ех 是 非 正 的 。 
Елх>>91-х>-0 
(Б. Вх А 2147483648 (ТМ). 那么 x 和 -x 都 为 偶数 。 
F. x*y == uc*uy, 
Н. 二进制 补 码 和 无 符号 乘法 有 相同 的 位 级 行为 。 
С. x*y + uytux == -у, 
R. "x AFl. utu 等 十 x*y。 轩 此 ， 左 手边 等 价 村 -x*y-ytx*y。 
练习 题 2.31 答案 
理解 二 进 制 小 数 表 小 是 理解 浮 点 编码 的 一 个 重要 步 又 。 这 个 练习 让 你 试验 一 些 简 单 的 例子 ，。 


十 进 制 表 示 





信息 的 表示 和 处 理 99 


CER) 





£ Ë b| MORS Y 个 简单 方法 是 将 一 个 数 表 示 为 形 如 E, 我 们 能 够 将 这 个 形式 
表示 为 -: 进 制 ， 过 程 是 : RUD 的 一 进 制 表示 ， 并 把 二 进 制 小 数 点 播 入 从 右边 算 起 的 第 上 МУ. 
x -个 例子 ， ЕРТЕ, 我 们 有 23, = 10111。 然 后 我 们 把 二 进 制 小 数 点 放 在 从 者 算 起 的 第 四 售 ， 
得 到 1.01115. 


练习 是 2.32 答案 


在 大 多 数 情况 中 ， 泪 点 数 的 有 限 精度 不 是 主要 的 问题 ， 因 为 计算 的 相对 错误 仍然 是 相当 低 的 。 
然而 住 这 个 例子 口 ， 系 统 对 于 绝对 误差 是 很 敏感 的 。 
A. 我 们 串 以 看 到 * -0,1 的 二 进 制 表示 为 ; 


0.000600000060000000000001100[1100] = ; 


把 这 个 表示 与 -的 一 进 制 未 进 行 比较 ， 我 们 可 以 看 到 这 就 是 2 о, 也 就 是 大 约 9.54 x 
107%, 

B, 9,54 x 10? x 100 x 60 x 60 x 10 = 0.343, 

C. 0.343 x 2000 = 687, 

练习 题 2.33 答案 


研究 非常 小 的 字 长 的 浮 点 表示 能 够 帮助 澄清 IEEE 削 点 是 怎样 工作 的 。 要 特别 注意 非 规格 化 数 和 
规格 化 数 之 间 的 转换 。 
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练习 题 2.34 答案 
十 六 进 制 0х354321 3 fr Е RU T1101010100001100100001]. #2 5 21 ҮНІ 
I.101010100001100100001; x 2 。 我 们 通过 除去 起 始 位 的 1 并 增加 2 个 0 形成 小 数 域 ， 从 而 得 到 
[10101010000110010000100]. 指数 是 通过 21 加 上 仿 置 量 127 形成 的 , 得 到 148( 二进制 [10010100])， 
我 们 把 它 和 符号 域 避 联合 起 来 ， 得 到 一 进 制 表 示 
[01001010010101010000110010000100] 
ВЕ АРА АЕ ОН, ЖИН НД АН ЖІТІ, FO CERE 21 fr; 


0 Ü 3 5 d 3 2 1 
00000000001101010100001100100001 


Жок CE e eA CE k'k Kk k -k+ Tk kk Kk E 


4 А 5 о ÙÜ C B & 
Ü10010100101061010000110010300100 


练习 题 2.35 答案 
这 个 练习 帮助 你 思考 什么 数 是 不 能 用 浮 疡 准确 表 丰 的 ， 
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x^ CE RE. ЖЕ ЖИТО. ЖЕҢІ, $3852" +1. 

当 m=23 时 ， 值 是 2 +1=16777217. 

练习 题 2.36 答案 

一 般 来 滴 ， 使 用 库 宏 (iibrary macro) 会 比 写 你 自己 的 代码 更 好 -一些 。 然而， 这 段 代 合 似乎 可 以 
二 作 在 多 种 机 器 上 ，。 

ЖАПЫ ЕН e400 HEA EF 


code/data/teee.c 
1 &define POS NFINITY 1е400 
2 Rdefire NEG INFINITY (-POS ІМЕІМІТУ) 
3 &define NEG ZERO (-1.0;POS ІМЕІМТТҰ) 
codendata/ieee, c 


练习 是 2.37 答案 
这 样 一 个 练习 可 以 帮助 你 提高 从 程序 员 的 角度 来 研究 浮 点 运算 的 能 力 。 
确信 自己 理解 下 面 每 一 个 答案 。 


А.х == (int)ífloat) x 
i Bi SpA x X; TMax 时 。 
B.x == (int)!double)] x 


对 ， 内 为 double 类 型 比 int 类 型 具有 更 大 的 精度 和 范围 。 
C. f == (float) (double! f 


М, EI double 类 型 比 бом 类 型 具有 更 大 的 精度 和 范围 。 


D.d == (float) d 
S, Яш, "4d Aj 140 时 ， 我 们 在 右边 得 到 +eo。 
Е.Е == -I-F) 


Ai. EATE НИЯ US НЕ ЕК М. 
Е2/3 == 2/3.0 


错 ， 堪 边 的 值 将 是 整数 值 0， 而 右边 的 值 是 浮 点 数 .< 的 近似 人 


G. (d >= 0.0] 11 ((d*2) < ].0 
灶 ， 因 为 乘法 是 单调 的 。 
H. (à«£)-d == f 
їн, (e d dixe f Ë lM, ХАЖ Ж Мау, MARRE 1. 
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ЕННЯЕЫЛ СІНЕН, RIRE ГЕ АИИ Я ЗЕ. ЖСК, FHAN 
BHATE EY РА ФН E ЕЛА ШО ЕТЕН (memory) 和 用 来 执行 计算 的 低级 指令 ， 
大多 数 时 剧 ， 在 高 级 语言 提供 的 较 高 抽象 级 别 上 工作 会 政 有 成 就 种 靠 。 编 详 器 提供 的 类 型 检查 能 
HIP ACR YP ERR, ЖЕЕ АЕ ВЕ AS ВНЕ BEES. ТЕЛА. 
ҮН, БЕКА X qb 5 — HEB ЕСЕЛІ ТІН ЫЫ НЕН. ЖІ. 
Ад, HARE ШЕН КРИТ АРАНЫ ЕКЫ Fah ir, ТЇЙ ИЕЛІ Б А РЕ 
UMEN. 

SRL А НИН, НЕЯ ТРЕНЕР, РИКА ИЛ ANI д mug 
重 昌 的 技能 ， 启 动 编 谋 器 时 带 上 适当 的 选项 ， 编 译 器 就 会 产生 CLA Ef. УСА Е Ж 
过 于 秆 算 机 执行 的 实 蒜 机 器 代码 。 与 日 标 代码 的 二 进 制 格式 相 比 ， 它 葛 主 要 特色 在 十 它 采 用 的 是 更 
加 易 读 的 区 本 履 式 。 通 过 阅读 这 些 汇 编 代 包 ， 我 们 能 够 理解 编译 器 的 优化 能 力 ， 并 分 析出 代 坦 中 淤 
在 的 低 效率 。 就 像 我 们 将 在 第 5 章 中 看 到 的 那样 ， 一 个 试图 优化 -- 段 关键 代码 性 能 的 程序 员 ， 通 党 
会 莹 试 源 气 码 的 各 种 形式 ， 每 次 编译 并 检 千 产生 出 的 汇编 代码 ， 从 而 了 解 程序 将 蜗 运行 的 效率 是 如 
何 的 。 紫 外， 也 有 些 时 收 ， 高 级 语 寺 提 供 的 抽象 层 会 隐藏 我 们 想 要 理解 的 一 些 信 上 息 ， 如 程 赃 的 运行 
时 行为 。 例 如 ， 第 13 章 中 会 讲 到 ， 妆 有 几 线 程 包 写 并 发 程序 时 ， 知 道 用 何 种 存储 《storage) KETA 
种 程序 变 攻 是 很 重要 的 ， 而 这 些 信息 在 汇编 代码 级 是 可 见 钓 。 程 序 员 学 习 汇 编 代 人 码 的 需求 随 关 时间 
WSA Е Y МЕ, HIRR ERREA mie RERE BA STET. MEIE КТП BER al 
读 和 型 解 优 化 纺 译 器 产生 的 代码 。 

在 本 草 中 ,我 们 将 学 习 某 种 汇 鲍 语言 的 至 细 内 容 ， 明 白 忆 程序 是 如 柯 编 洋 成 这 种 形式 的 机 器 民 
码 的 ， 为 了 阅读 网 译 器 产生 的 汇编 代码 ， 除 了 具备 王 工 编写 汇编 代码 的 能 轧 外 ， 还 包括 其 他 一 些 技 
能 。 我 们 必须 了 解 典 型 的 编译 器 在 将 程序 结构 变换 成 机 器 代 公 村 所 做 的 转换 。 相 对 于 C 代码 中 表 
下 的 计算 操作 ， 优 化 编 诺 器 能 够 重新 排列 执行 顺序 ， 消 除 相 必要 的 计算 并 蔡 换 慢 速 操作 ， 例 如 几 圳 
法 和 移 位 米 代 替 习 法 ， 其 至 于 将 递归 计算 变 搞 成 村 代 计算 。 理 解 源 代码 与 对 应 的 汇编 码 的 关系 通常 
不 太 容 易 一 一 就 像 监 拼 出 一 幅 跟 盒 了 上 的 图 片 设计 有 点 不 太一 样 的 拼图 。 这 是 一 种 这 向 工程 (Teverse 
engineering) —— x BEAR ZEN m 作 ， 来 试 着 了 解 系统 被 创建 的 过 程 。 在 这 个 情况 中 ， 系 统 
是 - -个 机 器 产生 的 沪 编 语 寺 程序 ， 侧 不 是 由 人 设计 的 某 个 东西 。 这 简化 了 道 向 [C 程 的 任务 ， 因 为 产 
生 的 代码 遵循 相当 规则 的 模式 ， 匡 我 们 可 以 做 试验 ， 泪 编译 器 产生 许多 不 同 程序 的 代码 。 在 我 们 的 
长 述 中 ， 给 出 了 许多 示例 和 练习 ， 来 说 明 汇 编 语 言 和 编译 器 的 各 个 方面 。 精 通 组 节 是 理解 更 深 和 更 
基本 概念 的 先决 条 什 ， 花 点 时 间 研 究 这 些 示 例 并 完成 练习 是 非常 值得 的 ， 

下 面 , 我 们 篇 要 回 威 Imel 的 体系 结构 。Intel 处 理 器 从 1978 年 那个 相当 简单 的 16 售 处 理 器 发 展 
认 来 ， 现 在 已 经 成 为 了 桌 而 计算 机 的 十 流 机 器 。 随 着 新 特性 的 加 入 ， 体 系 结构 也 在 相应 地 成 长 ， 从 
16 ААЖ ЖА?А ЙА Т ҰҚ 32 位 数据 和 地 址 的 结构 。32 位 结构 是 相当 背 翌 的 次 计 ， 有 些 特性 内 
内 内 中 的 仙 度 来 看 才 有 意义 。 它 还 负担 着 提供 后 向 茹 容 性 的 仔 务 ， 这 是 现 尼 编译 器 和 操作 系统 不 央 
和 鉴 考 虑 的 问题 ,我们 将 关注 的 是 那些 被 GCC 和 Linux 使 用 的 特性 的 子 集 , 这 样 可 以 避免 许多 复杂 性 
以 及 IA32 的 隐秘 特性 。 

我 们 的 技术 讲解 是 从 快速 浏览 C、 汇 编 代 码 以 及 目标 代码 之 间 的 关系 开始 的 。 然 后 会 讲 到 IA32 
网 细 方 ， 从 数据 的 表示 和 处 理 ， 及 控制 的 实现 开始 。 我 们 会 看 妈 如 何 实现 蕊 语言 中 前 控制 结构 ， 如 
if. while 和 switch 语 血 。 这 上 时， 我 们 会 讲 到 过 程 的 实现 包括 运 行 栈 是 如 何 支持 过 程 间 数据 和 控制 
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的 传递 ， 以 及 局 部 变量 的 存储 (suorage), ЖЖ, ЖИП ЖЕ {ЕДЖ УЛИ RU. SEPT 
(union) 这 样 的 数据 纺 构 。 有 了 这 些 机 器 级 顷 程 的 背 矢 知识， 我 们 会 看 看 存储 器 访问 越界 的 问题 ， 
以 及 系统 容易 遭受 缓冲 区 道 出 攻击 的 问题 在 这 - -部 分 的 结 是 ， 我 们 会 给 出 -- 些 用 GDB 调试 器 来 
检查 机 器 级 程序 运行 时 行为 的 技巧 。 

接 下 来 是 标 了 是 号 “*” 的 内 容 ， 这 是 为 专门 的 机 器 语言 爱好 者 准备 的 。 我 们 讲述 了 1432 212 
AARE. E IA32 АРАТА НЕ, РЧА Е Р КА ВЈ 
АЖЕ ККТ. ЕЕ А Г F ОСС W& СЕРЕ АЛД ОЗЕ. ПОЛУ НЕ 
Н, ЕНАЙМЛИ s CIO UJ I] 9188 Р) ЖЕЕ. АШ. ККАЛ Ж ПИ КЕПИ ЛЕ. 


31 历史 观点 


Intel 处 理 器 系列 的 产生 是 -个 长 菲 的 .不 断 进 化 的 发 展 过 程 。 它 开始 于 一 个 单 芯片 、16 位 微 处 
理 器 ， 由 于 当时 集 减 电路 技术 水 平 十 分 有 限 ， 其 中 不 得 不 敌 了 很 多 受 协 。 只 此 以 后 ， 它 不 断 地 成长， 
利用 技术 的 进步 去 满 是 更 高 性 能 和 支持 更 高 级 操作 系统 的 需求 。 

ТУ ЕЛ Т ИЕ [ЧИРЕН] Intel 处 理 器 模型 ， 以 及 它们 的 一 些 关 键 特性 。 我们 用 实 
ВЕ КЕЕ ДЕНТТЕР ЖЕК ЕН ЕЛЕНЕ ЕРЛІК 表示 1000, 而 M 表示 1000000). 

8086: (1978, 29 区 个 晶体 管 )、 它 是 第 一 代 单 世 片 、16 E TEE Bas —. 8088, UU 8086 Pn Y 
8 位 外 部 总 线 《〈extemal busy， 构 成 最 初 的 IBM 个 人 计算 机 前 心脏 。IBM 与 当时 还 很 小 欧 微 软 签订 
Al, FA MS-DOS 操作 系统 。 了 最 初 的 机 器 型 号 有 32 768 字 节 的 在 入 器 和 两 个 软驱 没有 便 得 驱 
动 路)。 从 体系 结构 上 来 说 , 这 些 机 器 只 有 655 360 字 节 的 地 址 空间 一 一 地 址 只 有 20 Фу K: (1 048 576 
字 玉 可 被 寻 址 )， 而 操作 系统 保 禄 了 393 216 АН. 

80286: 11982，134K 个 品 体 管 )。 增 加 了 更 多 的 寻 址 模式 有些 现在 已 经 废弃 了 )。 构 成 了 IBM 
PC-AT 个 人 计算 机 前 基 础 ， 这 种 计算 机 是 MS Windows 最 初 的 使 用 平台 。 

1386: (1985, 275K 个 晶体 管 )。 将 体系 结构 扩 虹 到 32 位。 增加 了 平面 寻 址 模式 《fiat addressing 
model), Linux 和 最近 版 本 的 Windows 系列 操作 系统 都 是 使 用 的 这 种 模式 。 这 是 Intel 系列 中 第 一 台 
支持 Unix 操作 系统 的 机 器 。 

i486. (1989, L9M 个 晶体 管 )。 改 善 了 性 能 ， 间 时 将 浮 点 单元 集成 到 处 理 器 芯片 上 上， 但 是 没有 
改变 指令 集 。 

Pentium: (1993, 31М 个 晶体 管 ;。 改 善 了 性 能 ， 不 过 只 对 指令 集 增 加 了 小 的 扩展 ， 

PentiumPro: (1995, 6.5M 个 晶体 管 )。 引 入 全 新 的 处 理 器 设计 ， 在 内 部 被 称 为 P6 微 体系 结构 。 
指令 集中 增加 了 一 类 “条 件 传送 〔conditional move)" 184. 

Pentium/MMX: (1997, 4.5M 个 晶体 管 )。 在 Pentium 处 理 器 中 增加 了 处 理 束 数 向 量 的 新 指令 
ж. 每 个 数据 可 以 是 1、2 或 4 个 字 节 长 。 每 个 向 量 总 长 64 位， 

Pentium M: (1997. 7М 个 晶体 管 )。 通 过 在 P6 徽 体 系 结构 中 实现 MMX 表 令 ， 侣 并 了 以 前 分 
离 的 PentiumPro 和 Pentium/MMX 系列 。 

Pentium Ш: (1999, 8.2M 个 而 体 管 )。 引 入 另 一 类 处 理 闽 数 或 浮 点 数 向 量 的 指令 ， 每 个 数据 可 
以 是 1、2 或 4 ҰТК, БАЯ 128 位 的 向 量 。 由 于 在 芯片 上 包括 了 二 级 高 速 沁 存 ， 这 种 芯片 后 来 
的 版 本 最 多 使 用 了 24M "SE. 
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Pentium 4: (2001, 42M 个 晶体 车 )， 女 向量 指令 中 增加 了 8 字 节 收 数 和 浮 点 格式 ， 以 及 针对 
这 些 格式 的 144 个 新 指令 。 化 编号 惯例 上 ，Intel 不 髓 使 用 罗马 数字 。 

每 个 时 间 上 相 鳞 的 处 理 器 设计 痢 是 后 向 兼容 的 一 一 也 就 是 ， 较 早 版 本 了 编 详 的 代码 是 可 以 在 较 
新 的 处 理 器 上 运行 的 。 正 如 我 们 会 看 到 的 那样 ， 为 了 保持 这 种 进化 上 土 统 ， 指 今 集 中 有 许多 非常 奇怪 
的 东西 。Intel 现在 称 其 带 令 集 为 1A32， 也 就 是 “lntel132 位 体系 结构 【Intel Architecture 32-bit)”, 1X 
个 处 理 器 系列 也 俗称 为 “x8&6"， 反 映 出 直到 i486 的 处 理 路 命名 惯例 ， 


S. (АЛІ 1586? 

ше ЖЖ ИИ REL LAC E MER. EDDA LEE CPU 编号 的 商标 保护 。 关 因 商 
标 局 不 允许 用 数字 作为 商标 ， 因 此 ， 他 们 创造 了 "Pentium" 这 个 词 ， 用 的 是 希腊 词根 реша, A 
这 是 他 们 的 第 五 代 机 器 ， 从 光 以 后 ， 他 们 就 使 用 这 个 词 的 变 体 ， 即 使 Pentiumpro 是 第 六 代 机 器 (Ж 
此 内 部 称 为 P6)， 而 Pentium 4 是 第 七 代 。 每 出 现 新 的 一 代 都 包括 处 理 器 设计 中 的 一 个 很 大 的 变化 ， 





Sf. ERER (Moore's Law? 


1.0E--08 — c  --— 
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indi EDT RR 
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如 时 我 们 画 出 上 面 列 出 的 各 种 1A32 处 理 器 中 晶体 管 的 数量 与 它们 出 现 的 年 份 之 间 的 图 ， 并 且 
使 了 轴 为 对 体 管 数 的 对 数值 ， 我 们 能 名 者 出 ， 增 其 是 很 畔 著 的 。 划 一 条 线 罕 过 这 些 煞 据 ， 我 们 看 到 
晶体 管 数 量 以 每 年 大 约 33 久 的 比率 增加 ， 也 诚 是 说 ,每 OO T A ЛЕРИНИ. 51432 的 
历史 上 ， 这 种 增长 已 经 排 续 了 大 幼 25 年， 

1965 Æ, Gordon Moore, Intel 公司 的 创始 人 ， 根 据 当 时 荡 片 拉 术 ， 也 就 是 能 成 在 一 个 此 片上 制 
造 有 大 约 64 SERE d IE. ЕЗЙ, TRIER OK А, Л ЕНДЕР 
骸 。 这 个 预测 就 称 为 摩尔 定律 。 正 如 事实 证 明 的 那样 ， 他 的 预测 不 公有 点 乐观 ， 而 且 太 和 赵 视 了 ， 在 
它 四 十 多 年 的 历史 里 ， 半 导体 工业 能 够 每 18 AARRE Я 48. 

ЯМАН, ӘЖЛЭНАНЕНЕВН КЕНЕ, ertt, АЙЫН 
容量 ， 和 处 理 器 性 能 。 


这 些 年 水， 有 儿 家 公司 生产 出 了 与 Intel 处 理 器 兼容 的 处 理 器 , 它们 能 够 运行 完全 相同 的 机 器 级 
KIT. 其中， 领头 的 是 AMD 公司 。 数 年 来 ，AMD 的 策略 一 直 是 作 技 术 上 上 紧 跟 在 Intel 后 面 ， 生 产 
性 能 稍 低 但 是 价格 更 便宜 的 处 理 器 。 最 近 ，AMD 已 经 生产 出 了 一 些 顶 级 性 能 的 1A32 处 理 器 ， 这 些 
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处 理 器 是 第 一 个 突破 商业 可 用 微 处 理 器 1G 时 钟 速度 门槛 的 。 昌 然 我 们 会 谈 到 Intel 处 理 器 ， 但 荐 这 
些 描 述 对 Intel 的 竞争 对 手 生 产 的 兼容 处 理 器 也 同样 通用。 

对 由 GCC 编译 器 产生 出 的 、 运行 在 Linux 操作 系统 平台 上 的 程序 , 感 兴趣 的 人 并 闪闪 注 到 1A32 
复 打 性 的 大 部 分 ， 最 初 的 8086 中 的 存储 器 模型 和 它 在 80286 中 的 扩展 部 已 经 过 时 了 。 作 为 替代 ， 
Linux 使 用 了 平面 寻 址 方式 《flat addiessing)， 在 这 种 寻 址 方式 中 ， 程 序 员 将 整个 存储 空间 看 做 一 个 
+ ЖӨН. 

只 列 出 的 发 展 过程 中 ,我 们 可 以 看 到 , IA32 中 加 入 了 很 多 处 理 小 整数 和 浮 点 数 向 量 的 格式 和 指 
令 。 增 加 这 些 特性 是 为 了 提 遍 多 媒体 应 用 程序 的 性 能 ， 醒 如 图 像 处 理 、 音 笑 和 福 括 编码 和 和 解码， 以 
及 三 维 计算 机 图 形 。 不 幸 的 是 ， 日 前 版 本 的 GCC 产生 药 代 码 不 会 使 用 这 些 新 特性 。 和 实际 上 ， 在 黑 
Ааа Е, ОСС 会 假设 它 是 为 一 个 1386 机 器 产生 代码 ， 编 详 器 不 会 试图 使 用 许多 褒 加 到 现在 
看 来 己 经 非常 老 的 体系 结构 的 扩展 特性 ， 


3.2 ”程序 编码 
КВП C ER, HIT XE pi.c 和 p2.c。 然 后 我 们 用 Unix 命令 行 编 详 这 段 代 码 ; 


unix» gcc -02 -o p pi.c p2.c 

命令 gcc 表明 的 就 是 GNU СН GCC。 因 为 这 是 Linux 上 默认 的 编 详 器 ， 我 们 也 可 以 简单 
地 用 CC 来 启动 它 。 编 详 选 项 -Q2 告诉 编 详 器 使 用 第 二 级 优化 通常， 提高 优化 级 判 会 使 最 终 程序 
运行 得 更 快 ， 但 是 编 举 时 间 可 能 会 变 长 ， 对 代码 进行 调试 会 更 困难 。 第 二 级 优化 尾 性 能 优化 和 使 用 
方便 之 间 的 一 种 很 好 的 妥协 。 本 书 中 所 有 的 代码 都 基 用 这 个 优化 级 别 进行 编 详 的 。 

这 个 命令 实际 上 调用 了 一 系列 程序 ， 将 源 代 码 转 化 成 可 执行 碟 码 ， 首 先 ，C HALE SAT Ey 
代码 ， 择 入 所 有 用 看 nelude 命令 指定 的 文件 ， 并 扩展 所 有 的 宏 。 其 次 ， 编 译 器 产生 两 个 源 文 件 的 汇 
编 代 人 码 ， 和 名 字 分 别 为 pl.s 和 ps. ТЖ, 汇编 器 会 将 汇编 代码 转化 成 二 进 制 目标 代 但 文件 plo 和 
p2.0。 最 后 ， 链 接 器 将 两 个 目标 文件 与 实现 标准 Unix FRA Ai рпм) 的 代码 合并 ， 并 产生 最 
终 的 可 执行 文件 。 我 们 会 在 第 了 章 中 更 详细 地 介绍 链接 。 


3.2.1 机 器 级 代码 
在 整个 编译 过 程 中 ， 编 译 器 会 完成 大 部 分 的 工作 ， 将 把 用 妆 提供 的 相对 比较 抽象 的 执行 模型 表 
示 的 程序 转 屁 成 处 理 器 执行 的 非常 基本 的 指令 。 汇编 代码 表示 非常 接近 于 机 器 代码 。 与 百 标 代 码 的 
一 进 制 格式 相 比 ， 汇 编 代码 的 主要 特点 是 用 可 读 性 更 好 的 文本 格式 表示 的 。 能够 理解 汇编 代码 以 及 
它 是 如 何 与 鼠 始 的 如 代码 相对 应 的 ， 是 理解 计算 机 如 何 执行 程序 的 关键 一 步 。 
汇编 程序 员 看 到 的 机 器 与 C 程序 员 看 到 的 机 器 差别 很 大。 一 些 通常 对 上 程序 员 屏 若 的 处 理 器 状 
axe n] АЧ: 
. 程序 计数 器 【 称 为 %eip) 表示 将 要 执行 的 下 一 条 指令 在 存储 器 中 的 地 址 。 
. 整数 寄存 器 文件 包含 8 个 被 命名 的 位 置 , 分 别 存储 32 位 前 值 .这 些 寄存 器 可 以 存储 地 址 (对 
WT C 的 指针 ) 或 整数 数据 。 有 的 寄存 句 用 来 记录 某 些 重要 的 程序 状态 ， 而 其 他 的 寄存 器 
用 来 保存 临时 数据 ， 例 如 过 程 的 局 部 变量 。 
. 条 忻 码 寄存 器 保存 着 最 近 执 行 的 算术 指令 的 状态 信息 。 它们 用 来 实现 控制 流 中 的 条 件 变 化 ， 
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IN imar hl if 8 while 语句 ， 

. PASA A Tt 8 个 位 置 ， 用 来 存放 浮 点 数据 ， 

昌 然 已 提供 了 一 种 模型 ， 可 以 在 存储 器 中 声明 和 分 想 各 种 数据 类 型 的 对 象 ， 但 是 汇编 代码 只 是 
简单 地 将 存储 器 看 成 个 很 太 的 、 按 字 节 寻 址 的 数组 。C 中 的 业 集 数据 类 型 ， 例 如 数组 和 结构 ， 在 
汇编 代码 中 是 用 连续 的 字 节 月 示 的 。 妈 使 是 对 标量 数据 类 型 ， 汇 编 代 码 也 不 区 分 有 符号 或 无 符号 整 
数 ， 不 区 分 奋 种 类 型 的 指针 ， 其 至 十 不 区 分 指针 和 蒜 数 。 

竹 序 存储 器 (program memaory 》 包 含 程 序 的 莫 标 代 妈 ,操作 系统 需要 的 -… 些 信息 ， 用 来 管理 过 
秩 调 州 和 返回 的 运行 时 栈 ， 以 及 用 户 分 配 的 存储 器 块 比如 说 用 malloc ЖЕН). 

RH E Edu SEM. 在 任意 给 定 的 讨 刻 ， 只 有 有 限 的 一 问 分 虚拟 地 址 是 合法 的 ， 
例如 ,虽然 IA32 n9 32 Ду Bh ht RT АЕ AGB 的 地 址 范围 , 但 是 一 个 通常 的 程序 只 会 访问 几 M EM. 
KE c 0 oL E BE TUB Р [н], 将 虚拟 闻 址 转换 成 实际 处 理 器 存 悄 器 processor memory? 中 的 物 
理 地 址 。 

一 条 机 器 指令 只 执行 弟 钊 基本 网 操作 。 例 旭 ， 将 两 个 存放 下 寄存 器 中 的 数 子 相 如 ， 在 仓储 但 相 
寄存 器 之 癌 传 递 数据 ， 或 是 条 件 分 支 转移 到 新 的 指令 地 址 。 编 评 器 必须 产生 这 些 指令 序 齐 ， 从 而 实 
МЗ К ЈА KE. ЕМЕН НЫНАН Fe PEUT. 


32.2 ”代码 示例 
maki AET codec, WA FRERE У, 


int accum = 0; 


i 

2 

3 int sumí(int x, int y] 

4 I 

5 ini L = x + y; 

B accum +*= t; 

7 return t; 

В ] 

在 命令 行 上 使 用 “-S” 移 项， 三 能 看 到 心 编 详 峰 产生 的 汇编 做 码 ， 


unix» gcc -O2 -S code.c 


这 会 鸽 编译 器 产生 一 个 汇编 文件 code.s， 但 是 不 做 其 他 进一步 的 工作 《通常 情况 下 ， 它 还 会 凋 
用 汇编 器 产生 日 标 代 码 文件 )， 

GCC 足 按照 它 自 己 的 格式 产生 汇编 代码 的 , 这 种 格式 称 为 GASCGm ASsembler, GNU 汇编 器 )。 
ЖІП БАН ДІН, 它 同 Intel 文档 中 的 格式 以 及 微软 编 详 器 使 用 的 格式 差异 很 人 。 从 参 
考 文献 说 明 中 可 以 获得 关于 如 何 找 到 备 种 汇编 代码 格式 文档 的 建议 ， 

汇编 代码 文件 包含 各 种 声明 ， 包 括 下 面 所 js: 

aum: 

push} %ерр 

movl $еѕр, %ерр 
movl 12[*ebp),&eax 
addl 8(%еБр) , %еах 
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addl €eax,accum 
movl tebp,S$esp 
popil ebp 
ret 
上 面 代 码 中 每 个 缩 进 去 的 行 部 对 应 于 一 条 机 器 指令 。 比 如 ，puashl EPRA ЖА Tp ds ebp 
的 内 容 续 和 程序 栈 中 。 这 段 代 码 中 已 经 除去 了 所 有 关于 局 部 变量 名 或 数据 类 型 的 信息 ， 但 我 们 还 是 
看 对 了 一 个 对 全 局 变量 accum 的 引用 , 这 是 因为 编译 器 还 不 能 确定 这 个 变量 会 放 在 存储 器 中 的 哪个 
位 置 。 
ШЕТІНЕН “-c” 命 令 行 选项 ，GCC 会 编译 并 汇 网 该 代码 : 
unix» gcc -02 -C code.c 
这 就 会 产生 目标 代码 文件 sode.o, 安 是 二 进 制 格式 的 ， 所 以 无 法 直接 读 。852 字 节 的 文件 code.o 
中 有 一 段 19 字 节 的 十 六 进 制 表示 的 序列 ， 
55 89 e5 Bb 45 бс 03 45 08 01 05 20 00 00 00 85 ec 5d c3 


РУТ ЕАС ВУАН. ААН, НЕОЛ 
РЕҢ Ro — ЖУБАН p A. ЖЖ АРЕ EDA bB S BJ АЫ ЛЕ B XL 
ih ШИРАН? 

ЙА, НЕЛЕ СНЛ, ФН) 来 确定 函 教 som 的 代码 长 是 19 1%. Ал. An 
在 文件 code.o 上 运行 GNU NK LR GDB, Wate: 

(gdb) х/19хЬ sum 

ФАЧ СОВ 检查 (简写 为 “x”}19 КЕШЕТІН 4”)8 3 CS» ғ). 
ежи, СОВЯВФЛЛИНЕТИАЯА СНК SISA, REEE 312 节 中 讨论 这 个 问题 ， 

要 查看 日 标 代 码 文 件 的 内 容 ， 有 -类 称 为 把 汇编 经 (disassembler) 的 程序 的 价值 无 法 估量 ， 这 


些 程序 根据 月 标 代 但 生 成 一 种 类 羽 于 江 编 代码 的 格式 。 在 Linux 系统 书 ， 带 “-d ”命令 行 选项 的 程 
序 OBJDUMP СЕЗЕ "object dump”)》 可 以 充当 这 个 骨 色 ， 


unix» obJjdump -d code.ao 
结果 是 “这 里 ， 我 们 在 去 边 增加 了 行 号 ， 在 右边 增加 了 注解 ): 


Disassembly of function sum in file code.o 
1 00000000 <шцш>; 


Offser Bytes Equivalent assembly language 
2 Ü: 55 push %еБр 
3 : 89 es mov esp, tebp 
4 3 Bb 45 Oc mov üxc(*ebp),$eax 
2 6: 03 45 08 ада ОхВ{%ерр) ,%еах 
б 3: 01 05 00 00 00 On ааа $eax, OxI 
7 f: 89 ас mov $ebp,*esp 
8 il: 5d рор iebp 
g 12: cài ret 
10 13: 95 nop 
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证 诺 边 ， 我 们 看 庆 按 昭 前 血 给 出 的 子 节 顺 序 排列 的 19 个 十 六 进 制 字 节 信 ， 它 们 分 成 了 一 些 组 ， 
每 组 有 1~6 个 字 节 。 每 组 都 是 -条 指令 ， 布 边 是 等 价 的 汇编 读 言 。 其 中 一 些 特性 值得 说 明 ， 


IA32 ESKEMA 1 一 15 个 字 节 不 等 。 指 令 编 码 被 设计 成 使 常 出 的 指令 以 及 操作 数 较 少 的 指 
令 所 所 的 字 节 数 少 ， 而 那些 不 太 常用 或 操作 数 较 和 多 的 指令 所 希 字 节 数 较 多 。 
指令 格 冻 是 按照 这 样 种 方式 设计 的 ， 从 某 个 给 定位 置 开 始 ， 可 以 将 字 节 惟 一 地 解码 成 机 
器 指令 ， 例 如 ， 只 有 指令 pushl %ebp 是 以 字 节 值 55 开头 的 。 

反 汇 编 器 内 是 根据 目标 文件 中 的 字 节 序列 来 确定 汇编 代码 的 。 它 不 需要 访问 程序 的 源 并 码 
BET 4845. 

BL Sf Ë H PUTET an RS GAS 使 用 的 有 些 细微 的 差别 。 在 我 们 的 示例 中 , ЕК 了 
很 多 指令 结尾 的 “1?。 

与 code.s 中 的 蕊 编 代 码 相 比 ， 我 们 还 发 现 结尾 多 了 -条 nop 指令 。 这 条 指令 根本 不 会 被 执行 
Ce PHARRR 4 2 ја), 即使 执行 了 也 不 侈 有 任何 影响 (所 以 称 之 为 nop, 是 “no operation" 
的 简写 ， 通 常 起 作 “no op”)。 编 译 器 插入 这 样 的 指令 是 为 了 填充 存储 该 过 程 和 的 定 间 。 


生成 所 际 可 执行 的 代码 需要 对 “组 目标 代码 文件 运行 链接 器 ， 而 这 一 组 日 标 代码 交 件 中 必须 仿 
有 一 个 man Ж. 假设 在 文件 maine ФАН ЕК АЖ. 


1 
2 
3 
4 


inL maini) 
Í 


returr sumíl, 3); 
Y 


然后 ， 我 们 用 如 下 方法 生成 可 执行 文件 test: 
unix- gcc -O2 -o prog code.o пайп,с 


文件 prog 变 成 了 11667 字 节 ,因为 它 不 仅 包含 我 们 的 两 个 过 程 的 代码 ,还 包含 了 用 来 启动 和 和 终 
二 硫 序 的 信息 ， 以 及 用 来 与 操作 系统 交互 的 信息 。 我 们 也 可 以 反 汇 编 prog X ft: 


unix» objdump -d prog 
反 汇 编 器 会 抽 私 出 备 种 代码 人 序列， 包括 下 面 这 段 ， 


1 
2 
3 
4 
= 
E 
E 


10 


Disassembly of functien sum in executable file prog 
080483b4 zsum»: 


8048314: — 55 push %ерр 

80483Һ8: 839 е5 mov евр, Фебр 
ADdB3p?: 8b 45 Dc пу üxciSebp),*eax 
80483ba: 03 45 08 add оха (ъерр) , зеах 
8DiB3bd: 01 05 64 94 04 DH add $eax,ü0xg8045464 
80483c3: 89 ec mov ebp, esp 
BD4B3ch5: 5d рер зерр 

804836: c3 ret 

B80483c7: 90 nop 


注意 ， 这 段 代码 与 code.c 反 汇 编 产 生 的 代码 儿 乎 完全 o ATEKA REP UO PH hk 


А] 
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全 局 变量 accum 的 地 址 。code.o 反 汇 编 代码 的 第 6 2118, accum 的 地 址 还 是 0。 prog АЧ 


程序 的 机 器 级 表示 Н 


н, ЖАДО ВВ Г 0х8049464. ixn] UL fi ФИГ ИТ АН ЕР, EA LLA TB IRR BL 
HEH K, АЮУ SUR S ІҢ ЇЙ S: 64 94 04 08. 


3.23 ”天 于 格式 的 注解 
GCC 产生 的 汇编 代码 有 点 难 读 ， 它 包 人 省 一 些 我 们 不 需要 关心 的 信息 。 男 外 ， 它 不 提供 任何 程序 
PERRE EMALE Ain BELI simple.c fus F 34088; 


1 int simpleíint *xp, int у} 
2 í 

3 int t = *Xp + y: 

d *xp = t; 

5 return t; 

b 


1 
当 带 选项 “-S$” 运 行 GCC 时 ， 它 产生 下 面 的 文 忻 simple.s: 


file  "simple.c" 

.version "01.01" 
асса compiled.: 
‚ех 

-align 4 
.globl simple 

‚суре simple,&function 
simple: 

push: *ebp 

mov] *esp,S$ebp 

movl 8(tebp),eax 

movl (*eax],€edx 

addl 12 [%ерр), %едх 

movi $edx,í(teax) 

movl €&edx,*eax 

movl Ферр, %еѕр 

popl %ерр 

rab 
.Lfel: 

.S1ze Simple,,Lfel-simple 

.ident "ССС: (GNU) 2.85.3 20010315 (release]" 


XB ES SETRIS SEN. ЯНА“. ЖЕТА С RU GEB hi q 
(directiye )， 不 过 我 们 通常 可 以 忽 赂 这 些 行 。 男 一 方面 ， 也 没有 关于 这 些 指令 是 十 什么 用 的 以 及 它 
们 与 源 代 码 之 间 关系 的 解释 说 明 。 

为 了 更 清楚 地 说 明 汇 编 代码 ， 我 们 将 给 出 汇编 代码 的 格式 ， 包 括 行 导 和 解释 性 说 明 。 凡 于 我 们 
的 小 例 ， 带 解释 的 汇编 代码 是 像 下 面 这 样 的 ; 


1 simple: 

2 pushl &ebp Save frame pointer 

3 movi %W%esp,%ebr Create new frame pointer 
4 movl 8(Жерр),%еах Get Хр 

5 movl {%еах), %ейх Retrieve *xp 
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6 addl 12í(*$ebp),*edx  xAddytogett 

7 movl %edx,(%eax) More t at Yxp 

8 movl $edx,*eax bet tas return value 
9 movl Sebp, еар Reset stack pointer 
10 popl *ebp Reset frame pointer 
11 ret Return 


TERUR ya ШБЖИ»ЕИ# ШЖХИКЕМТ. STAREA ЕЗІН, EU EIER. 
简单 地 描述 指令 的 效果 以 及 它 与 原始 C 代码 中 的 计算 操作 的 关系 。 这 是 一 科 汇 编 语言 程 夺 员 写 代 码 
P] URS o 
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由 于 是 从 16 {ЖЖ B Fk 32 (rB, Intel 用 术语 “ 字 Стога)" Жок 16 位 数据 类 型 。 БП. 
称 32 和 位 数 为 “ 双 字 (double words)”， 称 时 位 数 为 “四 字 (quad words)". ЗАТЕЯ E ЖӘН 
令 都 是 对 字 节 或 双子 操作 的 。 

31 给 出 了 对 应 C 基本 数据 类 型 的 机 器 表示 。 注 意 ， 人 多 数 常用 数据 类 型 都 是 作为 双 字 存储 
的 。 其 中 ,包括 普通 整数 (int) MERK (long int)， 无 论 它们 是 否 有 符号 。 此外， 所 有 的 指针 《在 
此 用 char Жо 都 是 4 学 季 的 双 字 。 椒 理 字 符 串 数据 时 ， 通 常用 到 字 节 。 浮 点 数 有 三 种 形式 Ж 
精度 Са) ің, HEF C 数据 类 型 float， 双 精度 FPH) 18. ONE C 数据 类 考 double: ЖІ 
扩展 精度 (10235) f. GCC 用 数据 类 型 long double 来 表示 扩展 精度 的 学 点 值 。 为 了 提高 存储 器 
系统 的 性 能 ， 它 将 这 样 的 浮 点 数 存 储 成 12 字 节 数 ， 行 会 儿 我 们 会 讨论 这 个 问题 , 虽然 ANSIC 标准 
包括 long double 数据 类 型 , 但 是 对 太 多 数 编译 器 和 机 器 组 合 来 说 , TL SCHULTER double PUJ 8 E ñ 
格式 是 一 样 的 ， 对 GCC 和 1A32 的 组 合 来 说 ， 支 持 扩 展 精度 是 很 少见 的 。 


+ b 


int 

unaidgned 

Long int 
unsigned long 


char * 


l 
2 
4 
4 
4 
4 
4 
4 


Ë loat 


doube 


еп 


long double 





图 4.1 标准 数据 类 型 的 大 小 
如 图 3.1 Pr. GAS 中 的 每 个 操作 都 有 一 个 字符 后 缀 ， 表 明 操 作 数 的 大小。 例如 ，mov (传送 
ЖИ 指令 有 一 种 形式 ;mowb【 传 送 字 和 节 )，、movw (EEE) 和 movi (传送 双 字 7。 后 组 “1? 用 来 
表示 疯 字 ， 因 为 在 许多 机 器 上 ，32 位 数 都 称 为 “长 字 Cong word)”， 这 是 沿用 以 16 位 学 为 标准 的 


fU FAC B и k + ЖЕТІ 


时 找 的 习惯 造成 的 。 注 意 ，@GAS ӨНЕ "I" ЖК OR 4 字 节 的 整数 和 8 字 节 的 双 精 度 浮 点 数 ， 
这 下 会 产生 剖 广 ， 因 为 浮 点 数 使 用 的 是 一 组 完全 不 同 的 指令 和 客 存 器 。 


34 ifm 

— A32 中 央 处 理 单 元 (CPU) 4%-ША T ЭО 0B IO dE ES. келтЕН НЫ 
БЕЗЕЯЗНН. 328g DuAdGERA. ППЕК RU е ИН. ЖИЕП HEISE 
T. ftl вове h, ЖР 16420. ЖЕТИН ЖЕШ. MUERE ТИЯЛЖЫЕНЕННІ 
建 的 。 在 平面 寻 址 中 ， 对 特殊 寄存 器 的 需求 已 经 大 为 降低 了 。 在 天 密 数 情 品 中 ， 前 坟 赴 害 存 器 部 可 
以 看 成 通用 害 存 器 ， 对 它们 的 使 用 没有 限制 ,我 们 说 “在 太吉 歼 情 况 中 *， 是 因为 有 些 指 他 是 以 固定 
的 寄存 器 作为 源 和 /或 目的 的 。 另 外 ， 在 过 程 【proceduresy Eh, GAS ATR bearn ecr 
ойх) НЕТЕТ ТИРЕ РО ТУ ЕЕ Стерх. Фош еа), {ПЕ 3.7 f 
НЭНА ОСЕ ЖЕҢЕГЕ С сор Mtep ЕТЕНЕ О ЕЕН О ТИНЕ. Dd 
SHE BETTERHEN P CHEM ЕПА РА ТТЕ Е ІНІҢ. 





Е 32 НЕЛЕ 
Br ATE ERR UTE PE S 160 CE axo pr OR) WGM. Ier TORRE BR uE. 


ШЕ 3.2 Жэ. T HERE HT ULM MUERE ЕШ НЕШЕ Ter S. s086 中 提供 
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ХЕ ШЕ Жу EAA 8008 ЖІ 8080. 8008 和 8080 是 两 款 可 以 追 述 到 1974 年 的 微 处 理 器 。 当 
ТОНАУ E yx ет “寄存 器 元 素 ” 中 的 一 个 时 ， 该 寄存 器 余下 的 三 个 末世 不 会 被 改变 。 
类 似 地 ， 字 操作 指令 可 以 读 或 者 写 每 个 寄存 器 的 长 16 位 。 这 个 特性 源 自 IA32 是 从 16 位 微 处 理 器 
演化 而 来 的 。 


3.4.1 操作 数 指示 符 

大 多 数 指令 有 -个 或 多 个 操作 数 【operand )， 指 杰 出 执行 一 个 操作 中 本 引用 的 源 数 据 值 ， 以 及 
放置 结果 的 莫 的 位 置 。IA32 支持 名 各 操作 数 格式 (图 3.3)。 源 数据 和 值 可 六 以 常数 形式 给 出 ， 盛 是 从 
寄存 器 或 存 竺 典 中 读 出 ， 结 果 可 以 存放 在 寡 存 器 或 存储 器 中 。 因 此 ， 各 种 操作 数 的 可 能 性 被 分 为 一 
种 类 型 。 第 - -种 是 立即 数 【immediatey， 也 就 是 常数 值 。 在 GAS 中 ， 采 用 标准 C 的 表 小 方法 ， 立 即 
数 的 书写 方式 是 “$” 后 面 跟 一 个 整数 ， 比 如 ，$-577 或 $0x1F。 任 何 32 {у ЕЖЕ] ELM OUT, 
不 过 汇编 器 在 可 能 时 会 使 加 一 个 或 正 个 字 节 的 编码 。 第 二 种 类 型 昨 青 存 器 register )， 它 表示 某 个 
寄存 器 的 内 容 ， 对 双 衬 操作 来 说 ， 可 以 基 八 个 32 位 寄存 器 中 的 一 个 《如 eax)， 对 字 节 柑 作 来 说 ， 
可 以 是 八 个 单 学 节 寄 存 器 元 素 中 的 一 个 Ошта. 在 我 们 的 图 中 ， 我 们 用 符号 E, 来 表示 任意 寄存 器 
а, НЫН R[E,I 来 表 涉 它 的 值 ， 这 是 将 寄存 器 集合 看 成 一 个 数组 RR， 用 寄存 器 标识 符 作 为 索引 。 

第 二 类 操作 数 蚌 存 诸 器 引用 ， 它 会 想 据 计算 出 来 的 地 址 《通常 称 为 有 兹 地 址 ) 访问 某 个 芷 储 器 
МЕ, AARTEEN “个 很 大 的 字 节 数组 ， 我 们 用 符号 Ms[Addr] 表 示 对 存储 在 存储 路 中 从 地 址 
Addr Тп) р 字 节 值 的 引用 。 为 了 简便 ， 我 们 通常 省 去 写 在 下 方 的 b。 

ШИ 3.3 所 水 , 有 名 种 不 同 的 寻 址 模式 , 多 许 不 同形 式 的 存 情 器 引用 。 表 中 底部 的 Imm(E,, E;, 3) 
是 最 通常 的 形式 。 这 样 的 引用 有 由 个 部 分 ; tX BIS SEE Imm， 一 个 基 址 寄存 器 ES -个 变 址 或 
索引 寄存 器 ES — МЕШІТ (scale factor) 5s， 这 里 5 必须 是 1、2、4 或 者 8。 然 后 ， 有 效 地 址 被 
计算 为 imm + RIE +RIE].s。 引 用 数组 元 素 时 ， 会 用 到 这 种 通用 形式 。 其 他 形式 兵 是 这 种 通用 形 
东 的 特 中 2 情况， 省 略 了 基 些 部 分 。 正 如 我 们 将 看 到 的 ， 当 引用 数组 和 结构 元 素 时 ， 比 较 复 杂 的 寻 址 
模式 是 很 有 用 的 。 


М[їтт) # xj 4 hl 
(Ea) M[R[E,]! Ін k 3 HE: 
Imm Ej) MI Imm+R[E;|] CAE EE ROO ӘН 


(Es, В) М[Е(Е, ЕЕ] 变 址 
Imm(E,, E) M[nm-R[E;HRIE;] d Hr 
[, Ej, 8) MIR[Es] Apis ЖЕЛЕДЕ. 
ітті, E, 5) M[/mmR[E;] sl fiiit ЖН hE 
(Ep, E, 8) МІМЕН МЕД `š] fpi АН E ur Л 
Immí(E,, Е, 5) MUmm-R [E R[E] `£] hu 38 dd ЛЕ — HL 


图 33 ЖЕБЕ 
操作 数 可 以 表示 立即 数 常数 ) 伯 、 寄 存 跨 值 成 其 来 自 存储 器 的 值 。 伸 缩 因 了 :必须 是 1|，2、4 或 者 8。 





程 库 的 机 器 组 表示 —— H5 
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最 频繁 使 用 的 指令 是 执行 数据 传 赣 的 指令 。 拘 作 败 符号 的 通用 性 使 得 一 条 简单 的 传 着 指 筷 能 名 完 
成 全 名 机 器 中 要 好 几 条 指令 才能 完成 的 功能 ,图 3.4 列 出 的 是 一 些 重要 的 数据 传送 指 村 ， 最 常用 的 是 
TERZI movi 指令 ， 洒 操作 数 指定 一 个 值 ， 它 可 以 是 立即 至 ， 可 以 存 克 在 者 存 器 中 ， 也 可 以 存放 
在 疗 储 些 中 ,目的 操作 数 指 定 一 个 位 置 , 它 可 以 是 害 存 器, ar ti R iris BERE. TA32 加 了 一 条 限制 ， 
传 建 指 他 的 两 个 操作 数 和 在 能 禾 指 向 存 全 器 位 置 。 和 将 一 个 值 从 一 个 存储器 己 置 振 到 另 一 个 存储 器 位 置 需 
时 两 条 指令 一 一 第 一 条 指令 将 淹 值 加 载 到 窗 存 嗣 中 ， 第 二 条 香 该 寄存 器 值 写 太 目的 位 置 。 

F 面 这 个 movi 指令 示例 给 出 了 源 和 目的 类 型 的 五 种 可 能 组 音 。 回 想 一 下 ， 第 一 个 是 新 操作 数 ， 
第 二 个 是 目的 操作 数 ， 


movl 
movl 
mawl 
mawl 
movl 


И ¿Em ы ы mL 


Fa teax 
kebp, esp 
(*adi,*&ecx], *éeax 
5-17, (Жеар| 
Waax,-12 (Webpi 


Immediate--Regisier 
Register Register 
Memary--Re gister 
Immediate--Memary 
Register: -Memory 


 movb SERBI. METER HE Hg. 4 ES R TERM. TANEN 3.2 中 所 
m THREE Khi. Жіші, mow 指 地 传送 两 个 字 节 ， 当 它 的 一 沾 手 作 数 为 害 
TEH, АНЫН 32 中 所 示 的 人 个 两 字 节 寄存 器 元 素 中 的 一 让。 
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mo D — Š HOST 
mb o $&D / p-s 000 | - 5 з | 
rovzkl D 一 ЖҒЕ (99 
Fushi 5 RI&ezp] = ind 4; m 
M[Rj&esp]] 
popl D D = M[R[*esp]]; 
K|t&esp!| ~ R[&espji4 
图 3.4 数据 传送 指令 
movsbl 和 movzbl 指令 负责 拱 贝 一 个 宁 节 ， 并 设 塞 开 的 操作 数 中 其 余 的 位 。movshl ТЕК 
作 数 是 单字 节 的 ， 它 执行 符号 扩展 到 32 位 (也 就 是 , ЖЮ 24 ЕЕ ТАТЕ АИИ, 
Bem Hinr. 3€ 008, movzbl 指令 的 源 操作 数 是 单字 节 的 ,在 前 面 加 24 О Е 321, + 
spe Л ЖИ НЕ. 
ян. PPRA bis 


仔细 观察 可 以 发 现 ， 三 个 字 节 传送 指令 movb. movsbi movzbl Zl $ imd dg € 31, ix yT — 
МА: 




















HR Жаһ = 8D, Феах = 98765432 


1 movb &dh,*al Deax = 9876548D 
2 movsbl &dh, %еах Феах = FFFFFFSD 
3 movzbi Жаһ,%еах Jeax = 0000008D 


ikki b. NOE %сах 的 低位 字 节 设置 成 %edx 的 第 二 个 字 节 。moyb 指令 不 改变 
其 他 三 个 字 节 。 根 据 源 字 节 的 最 高 位 ，movsbl ЫНА УВ 1 或 全 0。movzbl 指令 无 
论 如 何者 是 将 其 他 三 个 学 节 访 为 全 0, | 


报 乒 两 个 数据 传送 操作 是 用 来 将 数据 压 人 栈 中 和 从 栈 中 弹出 数据 的 。 正 如 我 们 将 看 到 的 ， 栈 在 
处 理 过 程 调用 中 起 到 至 关 重 要 的 作用 。pushl 和 гөрі 指令 都 只 有 一 个 操作 数 一 一 用 于 压 入 的 源 数 据 
和 用 耳 弹出 的 可 的 数据 。 程 序 栈 存 放 在 存储 器 中 某 个 区 域 。 如 图 3.5 所 伙 ， 找 向 下 增长 ， 这 样 一 来 ， 
栈 顶 元 素 的 地 址 是 所 有 栈 中 元 素 地 址 中 最 低 的 。( 根 据 惯例 ， 我 们 的 栈 古 倒 过 来 画 的 ， 栈 “项 ”在 图 
FIEL 栈 指 针 %esp 保存 着 栈 质 元 素 的 地 址 。 将 一 个 双 字 值 计 入 栈 中 ， 首 先 要 将 枝 指 针 减 4， 然 
三 将 位 写 到 新 的 栈 硕 地 址 。 因 此 ， 指 令 pushi Феһр 的 行为 等 价 于 下 面 这 样 丙 条 指令 ， 

505] 54, %ез 

mv 1 ер, (esp) 

它们 之 间 的 区 别 是 在 日 标 代 码 中 pushl 指令 是 编码 为 ] ТИІН ЦИЯ RS HERG 
个 学 节 。 图 中 前 两 栏 给 出 的 是 当 %esp 为 0х108 #l%eax 为 0x123 时 ， 执 行 指令 pushl wear 的 效果 ， 
首先 %esp 会 减 4， 得 天 0x104， 然 后 会 将 0x123 存放 到 存 情 器 地 址 0x104 处 。 

弹出 一 个 双 宁 这 样 的 操作 将 包括 从 栈 商 位置 读 出 数据 ,然后 将 栈 指针 加 4。 因此 ,指令 popl Феах 
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SHA F FERRARA, 
теуі {%ер!,%вах 
addl 54, teap 
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图 l5 HOMER 
ПЕНИИ ЕМ, BUDE ILI ЖА. ТИҢ “Л” ЖИИ. AX ИЙРИ A RUN С, ЖН ARE HEUTE (гізін: 
ЕНІ. Hip (mm. ШАДЕН ШЕРИ. ЕНЕН. 


图 3,5 的 第 三 栏 说 明 的 是 在 热 行 完 puh 后 立即 执行 指令 popi Фейк М, 先 从 存 依 器 中 该 出 
ІҢ 0к123, ЖУН сах Ф, ЖЕ. ЖЧТ Фер 的 值 将 增加 为 0x108。 如 图 中 所 示 ， 慎 Ox123 
Vii er DERE EE ERE UTE 0x104 中 ， 直 到 被 另 一 条 入 校 操 作 移 瘟 , 无 论 如 体 ，%esp 指向 的 地 址 总 是 
RT. 

НЕЕ ЫШЫ RE IE УРИ ЕВС RNE k E EHE ІР, ВЕРЕ T CLP f fn 
СЕВА hBi rh Ж. Яш, НЕНПІЛЖЕЛЕ. Hid movl ditespi, Фейх Ф 
ҰЯ УЧУН ЕЛ BW e «ейік. 
343 数据 传送 示例 
给 它 语言 初学 者 : 一 些 指针 的 示例 Ша. 

теь ад ИШ інен 

int x = “хр! BUS д: ыты 
Tor Ari RU p ahja iA, Arenaer х, Li S Ча 
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jË ó] 

*хр = y; 
正好 相反 一 它 将 参数? НЕ 3] хр 所 指 的 性 置 . 这 也 是 一 种 指导 间接 引用 的 形式 (所 以 有 操作 笠 
*)， 但 是 它 表 明 的 是 一 个 写 操 作 ， 因 为 它 是 在 庄 熏 语句 的 丰 边 ， 

下 面 是 一 个 使 用 exchange 的 例子 ; 

int a = 4; 

int b = exchange(&a, 3); 

printf ("а = %á, b = $din*, a, b); 

X BUS HT h: 

a = 3, h = à 

C HER (ЖА “Ан” Л) ШЛЕ. ERAF, Gere ЖКА ЧЕ а 的 
oR. Жа, AK exchange 将 用 3 RAE acp HR. RI 4 kb жені, 注意 如 何 将 措 
AE egehange， 它 能 修改 存在 某 沾 远 处 位 置 的 款 据 。 


code/asm/exchange.c 
int exchange(int *xp, int y) 


1 

2 í 1 movl 8{%ерр), %еах Get xp 

3 int x = *хр; 2 movl 1214%ерр) Жейх Get y 

1 3 movl {%сах}, жеси Get x at “хр 

5 *XD = Y; 4 movl %ейх,{%еах) Store y at *xp 

б return x; 5 movl %есх,%еах Set x as return value 
l 





code/asm/exchange.c 


ia; C RE (Б) Йй 编 代码 


46 exchange 005 C XUL RSS 
ШИЕЛІ АЛЫП Ы 


TEX Ë HR Hox BS ТИКИ, £ BEL 3.6 т КЕНЕТ. ШЕ C KD. E 
有 GCC "Emp Ық. RIER TERA НГ Я В, АКЫН ЖАЛАНЫ RARO S EST, 
以 及 在 过 程 返回 前 回收 起 空间 的 代码 . ЕТІНЕН, ЙА ЗУ ЗСД ВОЯ ЗУ. 
И ЗЕ FERES, RIRA “EFH body)”, 

qM EK Hind ir, Ж®® xp 和 у 存储 在 相对 于 寄存 器 名 ebp PHR 8 和 12 
的 地 方 。 指 令 ] 和 2 会 将 这 些 参 数 传送 寄存 器 %eax Фейх. 1893 间接 引用 хр, ЖАЯ 
寄存 器 和 ecx 中 ， 克 应 于 程序 值 x。 指 令 4 Жу хр. 指令 5 将 x 传送 到 寄存 器 多 eax。 报 所 
惯例 , 负 有 返回 整数 或 指针 值 的 汲 数 都 是 通过 将 结果 放 在 青 存 器 %eax 中 来 达到 目的 的 ,因此 这 条 
措 令 实现 了 C 代码 中 第 6 行 的 功能 。 这 个 例子 说 明 movi 指令 是 如 何 用 于 从 存储 器 中 读 值 到 寄存 
外 的 【指令 1-30, SUR M TAS SENSN GES 0. HADAA -AFTREE -个 
寄存 器 的 【指令 5)。 

天 于 这 段 汇编 代码 有 两 点 值得 注意 。 首 先 ， 我 们 看 到 & 中 所 谓 的 “指针 ”其 实 就 是 地 址 。 间 


| FUE Fin Ж фт 119 
— . .. > ... . _ Bs 
ЖОЛИ ЛЕНИННИ Sab, {ЕНЕ fo SLUT pA RC ERES. MOX. 
R x АННЫ ШНЕК ЕЕЕ. ПЕНЕН. ЗАР EE REB UL НАН 
£. 


* 53H32 
ЖЕН ET. -tFU 
void decode] (int “ұр, int *yp, int *zpli 
E lu plea КЩ. UU T 
movl В{%еър! „жеді 
mov] 12 (%ерр), Geb 
mov] 16(%ерр), tesi 
morl iW*edil,9]eax 
movl (&ebx]|,t«tedx 
шоу] í(*esil,*ecx 
mov] *eax,(ebxj 
movil *edx.(itoesi) 
movl tecx, ('tedi) 
T yp #* zp 8E Heb T ер rie d ER. 12 和 16 ex. 
ЖЕФ Edo IL HORE decodel ñ C FUB, TAA- ҖЕН ыд, rie E EE. 
t iE E Eo FUE d 5 BE Hd EA 3 AES mA ETE ba xi, iex sr ik ux 
PHH, 
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图 37 Rb T ЧЕНЕ, ФАП». LSÁLBIET CHARGER. ЕГ е 
ТЕН. ЕЕН КЕНТЛ 5 34 ИИ ЖЕШ. RET kal С, SERM НИ 
的 对 字 (16 Pr) ЖЕЗ MESES. EEA UI" 换 成 “mw” 就 是 对 字 的 操作 ， 而 换 成 “b” 就 是 
RPT ARRET. HU. addi 对 应 有 addw 和 addb. 


351 加 载 有 效 地 址 

加 载 有 效 地 址 (Load Effective Address? 指 寺 leal 实际 上 是 mol 8-5 AERE. 它 的 指令 形式 是 
只 存储 器 请 数据 到 寄存 器 ， 但 实际 上 它 机 本 髦 设 引 用 存储 器 。 它 的 第 一 个 操作 数 看 上 去 是 一 个 看 储 
器 引用 ， 但 访 指 他 井 不 是 从 指定 的 位 置 读 入 数据， 而 是 特有 效 地 址 写 信 到 日 的 操作 者 ні». 
EM 3.7 5 ГІН C ТЕ АЕ 来 说 明 这 种 计算 ,这 ЖЕФ T ELI Ag ri da КИН ШЕЕ 
指针 。 为 外 ， 它 还 可 以 用 来 简洁 地 据 述 普通 的 算术 操作 。 iim, ШЕФ, fh x. ЖАН 
# leal 7{%ейх, Фейх, 4), beak HURE tea 的 悄 为 5x +17, 注意 ， HEN ES 
是 一 个 害 存 县 。 

1$ 3B 3.3 


MILEA Жееах 483 x, %ecx 0548 % y. AEF, ЖӨЕ И {К ДЫЗ haha TA 
Beds fili. 


m 
-u 


KE: E cJ a i age La E 
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leal 6(%еах) ‚Фейх ШЕ 
тат ааа | 
ЕИ ИИ 
танаа | 
Ex ЖЕН ИЕН 
Deren | — — 


leal ШЕ жарға ігі 
| . 加 1 


%1 
ig 9 























л мз а in in njo ol; 
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Ей ОСЫН зай) 
FREH 
ештен 


图 3.7 整数 算术 操作 


Anci RUE (leal) 指令 通常 用 来 执行 简单 的 算术 操作 ,而 其 余 的 指令 是 非常 标准 的 一 元 或 .元 操作 。 注 意 ，GAS 中 的 操作 
SURE ЕН. 


35.2 一 元 和 二 元 操作 

第 二 闫 操作 是 一 元 操作 ， 只 有 一 个 把 作 数 ， 既 作 源 ， 也 作 有 日 的 ,这 个 操作 数 可 以 是 - -个 寄存 器 ， 
也 可 以 是 -个 存储 器 位 置 。 比 如 说 ， 指 令 incl sesb) 会 使 栈 顶 元 素 加 1。 这 种 语法 计 人 想起 台中 
的 加 P im ИЯ (++) BE ] 运算 法 〈--)。 

第 二 类 是 二 元 操作 , 第 二 个 操作 数 茎 是 源 双 是 目的 。 这 种 语法 让 人 想起 C 中 像 += 这 样 的 赋值 运 
算得 。 不过， 要 注意 ， 源 操作 数 是 第 一 个 ， 日 的 拒 作 数 是 第 二 个 ， 这 着 不 可 交 换 操 作 特 有 了 的。 例如 ， 
指令 subl %еах, %ейх {8 ех 的 值 碱 去 和 eax 中 的 值 。 第 -个 巢 作 数 可 以 是 立即 数 、 寄 在 
髦 或 是 行 栈 器 位 置 。 第 二 个 氛 作 数 可 以 是 寄存 器 或 是 存储 器 位 置 。 不 过 ， 间 шоу] 指令 - - 样 ， 两 个 
操作 数 不 能 同时 都 是 存 圭 器 位 置 ， 
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iH 3.4 
Wi Thak dE A dE AERE ЕЕ t, 







incl BíNBecx] 





sunl Tad täy 


353 BH 

ка ЕТ Шш. Pu prm. "ПШ ЖЕЛЩЕН. 11. 
METTIA, BAR ETOR a 位 的 称 位 , 称 位 量 可 以 是 一 个 查 即 数 , 或 者 放 在 单字 忆 害 
(Рала тр, ШИЮ 3.7 所 示 ， 堪 称 指 地 有 两 个 名 字 ，sall 和 呈 ， 两 者 的 效果 者 一样， 都 是 将 证 
WAE ЖЕН IS, sar ҖИ ЖЕН GAER HE, T she АННЫ? GRE 00, 


43H 3.5 
ип тай C MEAT Ka, 
int shift left2 rightní(int x, int nl 
| X <<= 2; 

X >>- HJ 

return x; 
] 


кап ишы. MEALS HEIC A Bra 中 ,此 外 省略 了 两 末 重 要 的 指 
T. kj xen h hak pR isa ebp P js E do 12 h. 
1 movi 12{%ейр) ,%есх ner n 


2 movl Bitebp), Жеах Del x 
1 ———— — rm ? 
1 т»»= Fi 


Жа АЖЕ, KHA ТЕ ЖИЙ ЕЕЕ. 
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3.5.4 讨论 

ETABI НКИ АК ЯН ЕЛЕНЕ ЕЕ. ЖЗНЕ ЖИ, E 
ЖЕЛДЕ ЕН ЕН НУ Ар. 

图 38 IB T “МАИТЯХВИКИЯ ЖОК, Ll M Jy advan, ЖЕНЕ СН, КІШІ 
I E LAE BRETT. ERÉUS x. y 和 z 分 别 存放 在 存储 器 中 相对 于 寄存 器 %ebp 中 起 址 偏 移 8、12 
A 16 T 7T. 


code/asm/arith.c 
int arithí:nt x, 
int v, 
int z) 


1 

2 

3 

4 

D int tl = x-y} 

б int t2 = z7*4B; 

7? int t3 = tl & OxFFFF; 
d int tá = t2 * t3; 
3 

1 

1 


0 return t4; 
1 } 
code/asm/arirh.c 
(a) C fI 
1 mov] 12{%еБр},%гах Get y 
2 movl 16 (%ерр), %едх Get z 
3 addl 8{%ррр),%еах Compute t1 = x+y 
4 leal (Фесх,%едх, 2}, Фейх Compute z*3 
5 sall 54,%edx Compute 12 = z*38 
б andl $65535,%еах Compute ІЗ = H &OxFFFF 
7 imull #сах, %едх Compute 14 = 12 +3 
8 movl *edx,£eax Set H as return val 
ЖЕСІН 
Ж 3.8 算术 运算 沙 数 体 的 CG 和 汇编 代码 
省 团 了 栈 的 建立 和 完成 部 分 。 


指令 3 实现 表达 式 x+y，- -个 操作 数 y 来 自 寄存 器 名 eax (由 指令 | 取出 )， 和 而 另 一 个 直接 来 自 
тта. ФФУ ИТИ zfr48， 首 先 使 leal 沸 令 对 伸缩 化 的 变 址 村 址 模式 的 操作 数 执 行 计算 
(z 22) = За. MATERA T BD RE 4 位， 以 计算 2.3z= 482. С 编译 器 常常 用 加 法 和 移 位 指令 来 完成 
总 教 因子 的 乘法 ， 就 像 2.3.6 节 中 讨论 的 那样 。 指 令 5 执行 AND SÍ. iit 1 执行 最 后 的 乘法 ， 
最 后 ， 指 令 8 将 返回 值 移 色 寄存 器 9%eax。 

(ЕҢ 3.8 的 汇编 代码 中 ， 寄 存 器 %eax 中 的 值 先后 对 应 于 程序 值 y、t1、t 和 二 【作为 返回 值 )， 
道 常 ， 编 译 器 产后 的 代 始 中 ， 会 用 一 个 寄存 器 存放 多 个 程序 值 ， 还 会 在 寄存 器 之 间 传 送 积 序 伯 ， 
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fi th ще дүр 
For (i = Úr i < n; 1++] 
V tz lr 


Па ET dde ah in. 

xorl Фейх, Жок 

EGRE EE AUT CPUS ЖЖ EXCLUSIVE-OR (AA ik K, iE g£ pb k ыны. 
ik $ERSCXGStCBÉPO EAE 
355 特殊 的 算术 操作 

图 3.9 描述 的 是 支持 产生 两 个 32 位 数字 的 使 研 位 飞 积 以 及 整数 除法 的 指 柱 。 





іх]: [асах] = Ях tea] 
Кейк]: [авах — $XR[teax] _ 
Ri*edx|:R[Aeax] — AF M Қағаз) | 
R[tedx] = Ritedx]:Riteax] nod 5 





839 特殊 的 算术 操作 
НИТ ЕЕ ЖЕНИ ЕН ы RUE REMO, HR Uds 和 Seax IE + ва БШ. 

B 37 中 列 出 的 imull 指令 称 为 “ 观 操作 数 ” 乘法 指令 。 它 从 两 个 32 КИЕ ЕЕ—1з2 03 
积 ， 实 现 了 34 和 了 35 节 中 描述 的 操作 * 号 和 * 和， 回想 一 下 ， 当 将 并 积 埠 到 为 2 位 时 ， 无 符号 
SW EFI RIYPA E — ВЕЙ. 1A32 Ж ИНЕТ ИЖЕ "RR Ей” ЖЫН. ШЕЙ 
两 个 32 监 值 的 全 64 (REL — I RICE PESE RE (тшй). ШИЯ — 4 JE — ЫНДЕ (итш). 
BPB Ж pim ik B DH FERE ЫН Фе h, S АЕН RE КИНИ. RER 
BLEBLIER beds (4320) ЖШФеах (15 3240) h, ЕЙ, ELS imal ЕЕ ҰНЫНА 
ЕЮ ЕЕЕ. ТЕАТРИНИ ЕЕН, ИЛЕН БЛ. 

ИПЖ Г, ШИН ЕЕ х Ж y НЕН Soebp ЙН A 12 的 位 置 ， Ñ 
习 和 希望 将 它们 的 全 G rat RIT ЕШТЕНЕ. ӨРЕ FAE: 


хан Жері, vat %еһр+12 
] movl Нійеррі,Зеах Put x in "bear 
2 imull 12[%ёеБр} Multiply by у 
3 push] жейх Push high-order 32 bits 
i pushl €*e&àx Push lini-order 32 bits 


ЕКПЕ WS AWMI, ЯН (ішемін) HUB EIB Б. dex mp 
BUE REIR ENS GEWER, ЖЕЛІ SE P b Hc О УИ, 
RATE SE ЖЕЕ CE 3л) ТШЕН (modulus) Bf. ЖЕК ЕЕ ST p 
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КҮРЕ. AA ЕНІН idiv] r3 bedi Cm 32 位 ) ШФ%еах (CK 32 (90. HAI 64 {Т ЕЛ 
锌 除数 ， 除 数 是 作为 指令 的 换 作 数 给 出 的 。 指 令 将 商 存 储 在 寄存 器 %eax 中 ， 将 余数 存储 在 寄存器 
Фейх 中 。cltd 指令 可 以 用 来 根据 害 存 器 %eax 中 存放 的 32 位 的 值 形成 64 位 被 除数 ,这 条 指令 将 %eax 
符号 扩展 到 %edx，。 
ira T. BRATS x H у 存储 在 相对 于 名 ebp 依 移 量 为 8 和 12 Ep S. ЖБ 
要 将 му A х%у TRR. ПИЕ FAAEA: 
x at Феђр+9, y at Wehp+ 12 


Й movl 8і%ерр), Жеах Put x in Фейх 

2 cltd Sign extend inta %ейх 
3 idivl 12{%еБр} Divide by y 

4 pushi %еах Push x / y 

5 push] *edx Push x % y 


div] 指令 执行 无 符号 除法 。 通 常会 事先 将 寄存 器 %edx Uz X 0, 


3.6 控制 


ЗІНШЕ, 我 们 考 虚 了 访 河 数 据 和 操作 数据 的 方法 。 程 序 执行 的 男 一 个 很 重要 的 部 分 灌 是 控 
制 被 执行 操作 的 顺序 。 对 С ЖГ 编 代码 中 的 语句 ， 软 认 的 方式 是 顺序 的 控制 流 ， 按 照 语 名 或 指令 在 
理 序 中 出 现 的 顺序 来 执行 。C PAREREA ERARE, ARGAS ИРУ) 
按照 非 顺 序 方式 进行 ， 妈 根据 程序 数据 的 值 来 确定 顺序 。 

汇 纲 代码 提供 了 实现 非 顺序 控制 流 的 较 低 层次 的 机 制 。 基 本 操作 是 跳 转 到 程序 的 另 一 部 分 ， 可 
能 会 视 某 些 测试 结果 而 定 。 编 译 器 产生 的 指令 序列 是 依赖 于 这 些 低 包机 制 来 实现 C 的 控制 结构 。 

在 我 们 的 讲述 中 ， 会 先 谈 到 机 器 级 机 制 ， 然 后 会 苔 出 如 何 用 它们 来 实现 C 的 各 种 控制 结构 。 


3.6.1 条 件 码 

PRISES. CPU 还 包含 一 组 单个 们 的 条 件 码 (condition code) AAB, CRET gE 
的 算术 或 逻辑 操作 的 属性 。 对 这 些 寄存 器 的 检测 ,将 有 助 于 执行 条 忻 分 支 指令 。 最 有 用 的 条 件 码 是 ， 

СЕ. 进位 标志 。 最 近 的 操作 使 最 高 位 产生 了 进位 ， 它 可 用 来 检查 元 符号 操作 数 的 谥 出 。 

ZF; 等 标志。 最 近 的 把 作 得 出 的 结果 为 0。 

SF: 符号 标志 。 最 近 的 操作 得 到 的 结果 为 负数 。 

OF: 游 出 标志 。 最 近 的 操作 导 彼 一 个 二 进 制 补 码 溢 出 一 一 正 溢出 或 负 浇 出 。 

比如 说 ， 我 们 用 ада 指令 乞 成 等 价 于 C RIAR t=a+b 的 功能 ， 这 申 变 时 a, b 和 (+ Ж ИЖ ОИ. 
然后 ， 会 根据 下 面 的 表 过 式 来 设置 条 件 志 : 


CF: (ursigned t) <tuasiqned a) 无 符号 溢出 
ZF: {б == 2] Ж 
SF; (t < 0) Ж 


ОЕ: (а < Ü == b < Ü) БЕ (t < 0 != a < O) ЖЖ ЖК 


1 Же, КАБУ оц. ЕЛ GAS 指令 名 与 Intel 的 名 字 无 关 的 情况 之 一 ， 
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leal ААА REST ERO. AAT EH Kik iri hair, Я- ЛШ, 37 中 列 出 的 所 有 指 
A bz НЕТИ. ATRE PD xorl， 进 位 标志 和 游 出 标志 会 设置 成 0。 对 于 称 位 操作 ， 
进位 标志 将 蔓 置 为 女 乒 一 个 赚 称 出 的 位 ， 击 浇 出 标志 设置 为 0。 

陈 了 图 3.7 Фа Е, PIERERARIST FREE CR 8. 16 和 32 位 形式 》， 它 人 只 设置 条 件 三 
而 不 改变 仔 何 其 他 寄存 器 。 


стр a 
tegth sas Si ú 


CREW + $i 一 

rtestw ТЕГІ M 

cmpl їз, 5 8-4; 

testl vr Si 5; & 5 I ы 





cmpb. cmpw 和 cmpl f ЕЛИН TER ERRER. 在 GAS RAH, ЖЕН 
的 顺序 是 相反 的 ， 使 得 代码 有 点 难 读 。 如 果 两 个 操作 数 相 等 ， 这 些 指令 会 将 零 标志 设置 为 L MH 
他 舶 标志 可 以 用 来 确定 两 个 操作 数 之 间 的 大 小 关系 。 

testb、testw 和 test] 指令 会 根据 它们 的 鸯 个 操作 数 的 与 AND) 来 设置 零 标志 和 负数 标志 。 通 
TRIER (AA, testi %eax, %еах 用 来 检查 %eax 是 负数 、 零 ， 还 是 正 数 )， 或 
其 中 的 一 个 操作 数 是 用 来 指示 哪些 位 应 该 被 测试 的 掩 公 。 


3.6.2 访问 条 件 码 
两 种 最 常用 的 访问 条 件 码 的 方法 不 是 霄 接 读 取 它 们 ， 而 是 根据 条 件 码 的 茶 个 组 合 ， 设 置 一 个 整 
数 寄 友 器 或 是 执行 一 条 件 分 支 指令 。 图 3.10 中 描述 的 是 各 种 set 指令 根据 条 件 码 的 某 个 组 侣 ， 将 一 
个 衬 节 设置 为 0 成 者 1。 目 的 操作 数 是 八 个 单字 上 节 寄 存 器 元 素 (图 3.2) 之 一 , 成 是 在 慷 一 个 字 节 的 
存 情 嚣 位置。 为 了 得 到 一 个 32 位 结果 ， 我 们 必须 对 最 商 的 24 位 清 零 。 
— C 判定 条 件 (例如 a<b} 的 典型 指令 序列 如 下 所 未 : 
Note: a is in edx, b is in %eax 


1 сірі Феах,%ейх Compare a:b 
2 setl %а1 Set low order byte of eax to 0 or J 
3 movzbl %а1,%еах Set remaining bytes af Seeax to 0 


movzbl RSA Жїн ЕС T m EE M. 

ЖЕКЕ Bo asd o HERE МЕСЕ, RUM "LX CGynonym?". Wie. “зер” CE 
示 “ 设 置 大 于 ”) 和 “setnle”( 表 示 “ 设 置 不 小 十 等 于 ”) 指 的 就 是 同一 条 机 器 指令 ,编译 器 和 反 汇 
жа zz DEAS Ut XE ТЕН АТАТ. 

ELA ЖИЕК ЕСЕН ЖҒНЕ, ІНЕ set ШП ROUGE ҒАН 一 种 情况 ， 执 行 
比较 指令 , 根据 计算 t=a -b 设置 条 忻 码 , РИШ. 就 sete 来 说 . 即 “* 当 相等 时 设置 (Set when equal)” 
指令 。 当 a=b 时 ,会 得 到 t=0， 内 此 等 标志 置 位 就 表示 相等 ， 
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(^ WA" | 


928 


getnle De :SF^I!OF]& ZF x CH NE ш>) 


setrl D-—^:sF^ OF) КЕЖЕ OHNE 

setnge 及 二 SR | OF жер (BASE) 

setng D- (ar^oz) |Z z 小 于 等 十 【有 符号 <=》 

setnbe ~ T ui CE Ee 

setnb ` 超过 或 相等 【无 符号 >=) 
set nae EF (KH 5<) 

setna ` ЖЕТЕН CEPS 

310 self 
每 条 指 专 根据 条 性 码 的 某 个 组 伟 ， 将 -' 个 字 节 设 置 为 三 或 者 1。 FEAA АХ”, 也 就 是 ， 同 -条 机 器 指令 有 列 的 书 宁 ， 


类 似 地 ， 考 虚 用 setl， 即 “ 当 小 于 时 疫 置 (Set when less)" 386, ЯНА- ТН. Ча 
和 hb RR] ЯЛЫ ЖАН, 对 十 a<b, 计算 两 者 之 差 时 , 我们 会 有 a -b<0。 当 没有 洲 出 发 生财 ， 
符 导 标志 置 位 就 表明 a<b。 当 因为 a-b 是 一 个 很 大 的 正 数 ， 出 现 正 溢出 上 时， 我 们 会 得 到 +< 0。 5 
因为 a - bE 个 很 小 的 负数 ， 出 现 负 溢出 时 ， 我 们 会 得 到 t > 0。 无 论 是 这 两 种 情况 中 的 种 ， 
符号 标志 都 表示 的 是 真正 的 差 的 吧 。 因 此 ， 溢 出 和 符号 位 的 异 或 测试 的 就 是 a cb. RUBRI SES B. 
较 测试 是 基于 SF ^ OF 和 ZF 的 其 他 组 合 

对 于 尤 罕 号 比较 的 测试 ， 当 万 符号 参数 a 和 b HEARRE, EA зл е 
(unsigned)b М, cmpl 指令 会 没 置 进位 标志 。 因此 ,这些 测试 使 用 的 羡 进 位 标志 АІ 


练习 题 37 


在 下 面 的 C 代码 中 ， 我 们 用 “  “” 赫 撞 了 一 些 比较 运算 符 ， 并 且 省 略 了 强制 类 型 转换 中 的 歼 
据 类 型 ， 





1 char ctestlint a, int b, int cj 

2 { 

3 char -1 = a __ b; 
4 char 22 = b i ) a; 
5 char L3 - ( c. ( ) а; 
5 char t4 = i tann ) С 
7 char L5 = Co b; 
8 Char tb = а __ 0; 
9 return t. + t2 + tji + td + t5 + t: 
10 } 

эг Ade CA. GCC 产生 了 下 面 这 样 的 江 编 代码 ; 
1 mewii Bi%ebpl ,$sSecx Gein 

2 movl l2(*ebp),%*esi Get b 

E cmpl %ев1,‚,%есх Compare a:b 
4 бері žal Compute 11 
5 cmpl %ecx,%esi Compare b:a 


21 


setb 
стра 


-li€ebp] 
vex, 16 (Sebp) 


setce -2{%ерр) 
movb %c1,%dl 


ctapb 


i6t*ebp),$dl 


setne %01 


cmpl $esi,-6[*ebp) 


setg 


-3i #tebp] 


testi *ecx,t€*ecx 


setc 
addb 
addb 
addb 
айдар 
ааа 


tdl 
-li&ebp),*al 
-2i*ebp),*al 
hl, {al 
-3it$ebpl,€al 
%41,%а1 


поуері *al,*eax 
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Compute 12 
Сотраге сїй 
Compute 13 


Compare a:c 
Compute t4 
Compare с:6 
Compute 15 
Testa 
Compute t6 
Add 12 to t1 
Add t3 to t! 
Add t4 to t1 
Add t5 to ti 
Add 16 to (1 
Convert sum from char to int 


з kam, EE CAI TAA | (Ai НУЛЕ РУ), 


363 跳 转 指令 和 它们 的 编码 


在 正常 执行 的 情况 让， 指令 按照 它们 出 现 的 顺序 一 条 一 条 地 执行 。 吏 转 ( jump ) 指令 会 导致 执 
行 切换 到 程序 中 一 个 全 新 的 位 置 (参见 图 3.11)。 这 些 跳 转 的 日 的 地 通常 用 一 个 标号 label) H. 


考虑 下 面 这 样 的 汇编 代码 序列 ; 
1 xorl €eax,$eax 
2 jmp .Ll 
3 novl (жаах),Жейх 
4 Ld: 
5 popl %ейх 


кс Ка НІ ASH 


jng 
Jm 
je 

jre 


Labei 
*Üperand 


Label 
Гаре! 





Set edax to 0 
Goto .Ll 
Null pointer dereference 


相等 /村 
т! WFE 


"ISF^OF) & ZF AF (EA Ee) 
"(GF^OF] AFFF (Aie) 
SF^OF 小 于 《有 符号 < 
LSF^OF} | ZF 小 于 或 等 于 【有 符 吕 <= ) 
жш Сары») 
ЖОЗЕ (Вы) 
T CENSO 
Еген {无 符号 <=) 


图 3.11 jump 指令 
dette HA. 有些 指令 有 “ 同 实 名 "， 也 就 是 同一 条 机 路 指令 的 别名 
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指令 jmp.L1 会 导致 程序 跳 过 movl 指令 ， 从 рор Rp jaa etik iy, (ЕРЕ НУС, 
汇编 器 会 确定 所 有 带 标 与 指令 的 地 址 ， 并 使 跳 转 自 标 (目的 指令 的 地 址 ) 编码 为 跳 转 指令 的 一 部 分 。 

imp 指令 是 碟 条 件 跳 转 。 它 可 以 是 直接 跳 转 ， 即 跳 转 日 标 是 作为 指令 的 一 部 分 编码 的 ， 也 可 以 
是 间接 跳 转 ， 即 跳 转 日 标 是 从 寄存 器 或 存储 器 位 置 中 读 出 的 。 汇 编 语言 中 ， 下 接 是 转 是 给 出 一 个 标 
ИЕЛЕН, ЯШ, bm uem "ILI". fa EBERT) SEE “*" JEIBER— АЕБ 
ЖА, BTE" mov] 指令 使 用 的 一 样 。 看 看 这 个 例子 ， 指 令 

Jmp *%еах 
用 寄存 器 %eax rh HB fE Split Hi, mis 


jmp *í($eax) 


Г Феах 中 的 值 作为 读 地 址 ， 从 存储 器 中 读 出 跳 转 日 标 。 

鞭 他 的 跳 转 指令 是 根据 条 件 码 的 某 个 组 侣 ， 或 者 卡 转 ， 或 者 继续 执行 代码 序列 中 上 条 指令 。 
请 注意 这 些 指 令 的 名 字 和 跳 转 条 件 与 set 指令 是 相 此 配 的 。 ІНІ set 指令 Е, 些 弃 层 的 机 器 指令 有 
多 个 名 字 。 条 件 跳 转 只 能 是 直接 张 转 。 

捍 然 我 们 不 关心 日 标 代 码 格式 的 细节 ， 但 是 理解 踪 转 指令 的 日 标 是 如 何 编码 的 戏 第 7 章 中 研究 
链接 诗 串 下 要 。 此 外 ， 在 解释 反 汇 编 器 输出 时 ， 它 也 是 很 有 帮助 的 ， 在 汇编 代码 中 ， 跳 转 日 标 是 用 
符号 慰 叶 书号 的 。 沪 编 颖 ， 以 及 后 来 的 链接 妖 ， 会 产生 跳 转 虽 标的 适当 网 码 。 逮 转 指 令 有 儿 种 不 问 
Hm, HERA HR -E РС 相关 的 【PC-relative，PC = Program Counter}。 也 就 是 ， 它 们 会 将 
[| xfi EISE Es ERR CERE СЕЛ Ж1 D BRE AEEA. Xo ES Mb s ШТ CA 
ША. СДИ E. SPREDE “Җай” ЫШ. НДУ P IRE Н. 508 
Ж ЗА PE 16 SERE H OR 1А. 

作为 一 个 与 PC 相关 的 地址 的 例子 ， 下 而 这 个 汇编 代码 的 片断 是 编 详 siye 文件 所 产生 的 。 它 
BARTET: 第 | TRE е 指令 前 问 跳 转 到 更 禹 的 地 址 ， 而 第 & 行 的 这 指令 后 向 跳 转 到 较 低 的 地 址 。 

1 jle .L4 If <=, goto desi? 

.р2а11дп 4,,7 Aligns next instruction to multiple of 8 

‚йб: desti: 

movi $edx,*eax 

sarl $1,€*eax 

subl %eax,%edx 

test] $edx,edx 
8 jg .L5 If >, goto desi 
3 ‚14: dest2: 
16 rovl €$edx,*eax 


~] cà їл ны Ам B3 


注意 ， 第 2 行 是 -条 针对 汇编 器 的 命令 (directive)， 它 会 使 后 面 指令 的 地 址 从 16 的 倍数 处 开 
И, 而 最 条 浪费 了 个 学 节 。 这 条 命令 是 为 “使 处 理 器 能 更 优化 地 使 用 指令 高 速 缓存 存储 器 1instmetion 
cache memory), 

mer ER “о” ҚАНЫН АҚАН. 

1 B: 7e 11 jle lb «sillys«0üx:b- Target = destZ 

2 а: За be 00 00 00 00 lea 0х0 %е5і}, %езі Added пора 
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3 10: 89 аб mov едх, %еах dest]: 

à 12: cl f8 01 sar 50х1, %еах 

5 J5: 29 c2 sub %еах,%ейх 

5 17: 85 dł test %ебх,%ейх 

7 19; 7f E5 jg 10 «sillysOxiü- Target = desti 
ü lb: 89 40 mov Фейх, %егх dest: 


$2118] lea 0х0 (%esi}; ,名 asi 指 令 没 有 什么 实际 的 效果 , 它 是 作为 6 个 学 节 的 空 指令 tnop)， 
使 得 下 一 条 指令 (第 3 行 ) 的 起 始 地 址 是 16 的 倍数 。 

АЛЫ ЕРЕКЕ, БФ ВЕ НІНІ ТИН Ж Өкі, 14897 КЕ Ox10. 不 过 , XX 
察 指 邻 的 尘 节 编 妈 ， 会 看 刘 跳 转 指 令 1 的 口 标 编码 {在 第 二 个 字 节 中 ) 为 Оха СЫ UD. PE 
如 上 Оха C HA iD)， 也 号 是 下 一 条 指令 的 地 此 ， 就 得 到 跳 转口 标 地 址 lb 十进制 27)， 也 就 是 
jn 8 的 地 址 。 

类 羽 邮 ， 跳 转 指 令 7 的 旦 标 用 单 宁 季 、 二 进 制 补 码 表 示 编 码 为 0x 人 【十进制 -11)。 将 运 个 数 加 
Eoxib (十进制 27》， 即 指令 8 的 地 址 ， 我 们 得 到 0x10 CARD 16), БІНЕ 3 的 地 址 ， 

正 刀 这 些 枫 子 说 明 的 于 样 ， 当 执行 与 PC 相关 的 寻 直 时， 程序 计数 器 的 值 是 跳 转 指 邻 后面 的 那 
条 指令 的 地 址 ， 而 不 是 跳 续 指令 本 身 的 地 址 。 这 种 惯例 可以 追 述 到 早期 的 实现 ， 当 时 ， 处 理 器 会 将 
蝎 新 程序 计数 器 作为 娄 行 一 条 指令 的 第 一 步 。 


inf ERE BEEF SCIL e АУРЕ Ж: 

1 НО4В3СВ; те 11 jle 30483db <в111у-дхір> 
2 8G483ca; Bd bé 00 00 20 00 1еа Әх01%евзі),Фені 

3 8048330: 89 40 mov есік, Зеах 

4 8048332: cl ІВ 01 қат 50х1,Жеах 

5 асавза5: 29 c2 sub eax, $edx 

6 8C 48337: 85 ао test Фейх, жейх 

7 8048339: ЧЕ £5 19 5048340 <sillv+Üx10> 
8 80483ар: 89 dp mov %ейх,%еах 


A EB И E F ЖІ ТІНІ ДЕДІ, {НӘ 1 行 和 第 ? 行 中 跳 转 日 标的 编码 并 没有 变 。 通 过 使 用 
LJ PC 相关 的 不 转 日 标 编码 ， 指 令 编 码 很 简洁 (只 需要 两 个 字 革 ), 而 且 目 标 忧 码 可 以 不 做 改变 就 移 
到 仓储 器 中 不 同 的 位 置 。 
5& 5] E 3.8 
# F OE RID TL NIA AP. EGRE AE X КЕТ. SETS X Tik ЗВ БИ. 
А. 下面 jbe 指令 的 目标 是 什么 ? 
804841с: 76 da jte AXXXXXXX 
BhOABdle: eb 24 jmp 8048144 
B. mov 46 4- d£) 3 AE #077 
XXXXXXX: ер 54 jmp 8048444 
ХХХХХАХ: с7 45 fg 10 00 mov 50х10, ОХЕЁЁЁҒЕЁЕ (жерр) 


C. ЁТЕ КАФ, ЕА HADE PC 相关 的 ， 且 是 一 个 4 字 节 的 二 进 制 补 得 款 、 字 节 是 
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REAR K ES ER PIS, Авен: ТАЗ2 МЕТ ИЯ, ЖЕКЕН А? 
8П48902: еЗ cb 00 90 00 jmp XXXXXXX 
8048307: 90 nor 
D. ЖЖЖЖ НАК Е Eie dr Sz eS ЖА, IE PRAE jmp 指令 编码 的 一 部 分 ， 
80483f0: ff 25 ер a2 04 jmp *0х804а2ей 
80483Е5: 08 
为 了 实现 СМ, НЕКАЯ ЖАПАН ЖЕН 36 IRR. AUD ALL 
下 最 常见 的 结构 ， 从 简单 的 条 件 分 支 开始 ， 然 后 考虑 搞 环 和 开关 语句 、 


3.6.4 翻译 条 件 分 支 

C 中 的 条 件 语 包 是 用 有 条 从 和 无 条 件 跳 转 结合 起 来 实现 的 。 例如 ， 图 3.12 给 出 了 一 个 计算 购 数 之 

其 绝 村 值 的 明 数 的 C 代 码 (a), (с) 是 GCC 产生 的 汇编 代码 ， 我 们 僻 建 了 对 应 的 C 版 本 ， 称 为 gatodi 在 
(b), ze n EUER HE OE ИЕЛІ. fb) 使 用 了 JC 中 的 Bote 语 句 ， 这 个 语句 类 似 于 汇编 代 
И ЛЖИ. #67 дого less 语 句 会 导致 -- 个 跳 转 ， 转 移 到 第 9 行 的 标号 J]ess 处 ， 上 略 过 了 
第 7 行 上 的 语句 。 请 注意 ， 通 常 认为 使 用 goto 语 句 是 - -种 不 好 的 编程 风格 ， 因 为 它 会 使 代码 准 以 阅读 
和 调试 。 主 我 们 的 斤 述 中 使 用 goto 语 句 ， 是 为 了 构造 描述 汇编 代码 程序 控制 流 的 C 程 序 。 我 们 称 这 样 
МСЖ “зоо ің”. 

НИН ЕН ӘЛЕК C3 行 )， БЕН. ДАНА RU HR x Ру, Ж 
Аз ЕЙ EVER у-х ҚЫН ОА 9 £70, 否则 就 继续 执行 计算 x-y 的 代码 (第 5 行 和 第 6 行 )。 
在 这 岗 种 情况 中 ， 计 算 结果 部 丰 放 在 寄存 器 %eax 中 ， 到 第 10 行 结 束 ， 在 此 ， 它 会 执行 线 完 成 代 凤 

ОЯН WASH KO, 

C 中 的 if-else EA Ji J АЛАЧ: 

if  (fest-expr) 
then-statement 


elge 
else-statement 


XX Hi test-expr 是 一 个 整数 表达 式 ， 它 的 取 值 为 0 СЕ U БО 或 者 为 非 0 ORBOS "85. 
两 个 分 支 洁 名 中 then-statement 和 else-statement) 只 会 执行 一 个 。 
对 于 这 种 通用 形式 ， 汇 编 实现 通常 会 使 用 下 面 这 种 形式 ， 这 里 ， 我 们 用 C 语法 来 描述 控制 流 ， 
t = test-expr: 
-f dt) 
qoto true; 
else-Matement 
qoto done; 
true: 
then-statement 
done: 


CWE П 999 2) then-statement 和 else-statement РЕ 5 А ІНІН, JENA Е 
X. ШЕНЕ ИТ ЕН ЕЕЕ, 
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code/asm/abs.c 
l int cotodifflint x, int y) 
à Í 
3 inl rwal: 
4 
n 17 (x < ү) 
一 一 ———— — — — code/asmvabs.e 6 gota less; 
1 int absdiffiint x, int v] 了 rval < x - y; 
2 d В qoto done; 
3 if (X < y] 9 less: 
4 return y - X; 10 rval = y - x; 
5 else 11 done: 
4 reLurn x у; 12 return rval; 
í | i3 ) 
— c0de/asm/abs.c code/asm/abs.e 
(а) BBC P Cb) t SEU HI gotoh А. 
1 movl 8í*ebp),$€edx Get x 
2 поу1 12 (%ерр), Феах Gel y 
3 cmpl %еах,%едх Compare x:y 
4 jl .L3 If <, goto less 
5 вир1 %eax,%edx Compute x-y 
6 movl %едх,%#еах Set as returm value 
7 jmp .L5 Goto done 
8 ‚13: less: 
3 subl Фейх, %еах Compute у-х as return value 
10  .L5: . done: Begin completion code 


(РЕЛ ЯШ 


图 3.12 条 件 语句 的 编译 
C 过 程 absdiff (а) £13 — T if-else Бар PERLAR Сс), TE C 过 程 gotadiff (b) RIETI S ECC. PORC 


iL FUR p eir ge vo RISE RE SH ERR 





练习 题 3.9 
当 给 出 下 列 它 代码 时 
coderasm/simple-if.c 
1 void cond(int a, int *p) 
2 { 
3 1f (p k& a > 0) 
4 ір += a; 
5 ) 
code/asm/simple-if.c 


GCC 会 产生 下 面 的 汇编 代码 ; 
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1 movi 5 {(%ерр\, едх 
2 movl 12[(*ebp),*eax 
3 test] £eax,teax 

4 je .D3 

9 testl Sedx, Sedx 

б jle .53 

/ addl $*edx, (езх) 

8 bài 


A. 按照 图 3.12 Cb PARKRA ACHA goto Uk, АТЕЙ. SARAWI ЖҚА 
éd gh. ЖАЛП 3: P ARRAS Ide L 2 WW ЕЖ 7835. 
B. НАНҒА CON p RR — мініп, ФА а АМ. 


3.6.5 ”循环 
СТЕЛА А, ED while. for 和 do-while。 汇 编 中 没有 相应 的 指令 存在 。 作 为 蔡 民 ， 
将 条 御 测试 和 跳 转 组 合 起 来 实现 竹下 的 效果 。 有 趣 的 是 ， 大 名 数 汇编 器 根据 个 循环 的 do-while Ж 
式 来 产生 循环 代码 , 如 使 在 实际 程序 中 , 这 种 形式 用 的 相对 较 少 。 其 他 的 循环 会 首先 转换 成 do-while 
形式 ， 然 后 纳 诺 成 机 器 代码 ,我 们 会 德 序 商 进 地 研究 循环 的 翻译 ， 从 do-while 开始 ， 然 后 再 研究 更 
ӘЖЕ. 
do—while 1 E^ 
do-while 语句 的 通用 形式 是 这 样 的 ; 
do 
bodv-statement 
while (tert-expry 


循环 的 效果 就 是 重复 执行 body-statement， 对 test-expr ЖҮН, іН TES RON dE, ЖАНЕ 
环 。 注 意 ，body-statement 至 少 执行 -次 。 
通常 ，do-while 的 实现 有 下 面 这 样 的 通用 形式 ， 
loop: 
body-staiement 
t = lest-expr; 
if (t) 
goto loop; 
作为 ”个 示例 ,图 313 给 出 了 一 个 用 do-while 循环 计算 Fibonacci 序列 中 第 n DURS P SRL 
Fibonacci 序列 是 这 样 递归 定义 的 ; 
F = 1 
Ёз = 1 
F, = Ft+F. п>) 
比如 说 ， 该 序列 的 前 10 Tou 1. 1. 2. 3, 5, 8, 13, 21, 344153. А do-while 循环 来 实 
М, FARA 所 =0 和 FQ 1 开始， 而 不 是 从 Fl 和 所 开始 的 。 


] int fib dwí(int n] 

2 1 

3 int i = 0; 

4 int val = 0; 

5 int nval = 1; 
6 

| do ( 

8 irt t 

9 val = nval; 
10 nval - t; 
11 l4; 

2 ) while (i < n; 
13 

14 return val; 

15 |) 


жә [m Dm 


0 


HB ЙН КИНЕ Bom. 





£O -1 ©з л мз ыш > ҥе 


FERRA 


= val + nval; 


(aC 代码 


.Là: loop: 


leal (Фейх, %ерх},% eax 
movl Фейх, $ebx 

movl &eax,tedx 

incl %есх 

cmpl %ев1,%есх 

-1 „16 


- 


mov] Жерх,%еах 


(b) 对 应 的 汇编 语言 代码 
图 3.13 Fibonacci 程序 do-while 版 本 的 C 和 汇编 代码 
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codefasm/fib.c 


code/asm/fib.c 


Сотрше t = val + nval 
copy nval to val 

Copy t 10 nval 
Increment i 

Compare in 

If less, goto loop 

Sei val as retum value 


И Ил f ЗЫ BINAE, АА - 张 列 出 寄存 器 和 程序 值 之 间 对 应 其 系 的 表 。 在 
这 个 例 了 中 ，body-statement 是 第 8 一 11 47, Xd t, val 和 oval 赋值 ， 并 将 i 加 1。 这 些 功 能 是 由 汇编 
代码 的 第 2 一 5 行 实现 的 。 表 达 式 i < nm 就 是 test-expr， 第 6 行 和 第 ?7 行 的 跳 转 指令 的 测试 条 件 实 天 


了 这 个 表达 式 ，。 


“ЕНІНЕН, ЖЖ val 接 进 寄存 器 名 eax， 作 为 返回 值 (第 8 行 )。 


创建 -个 像 图 3.13 (b) 中 那样 的 寄存 器 使 用 表 ， 对 于 分 析 汇 编 语言 程序 是 很 有 帮助 的 ， 特 草 


"du XP 


练习 题 3.10 
ST C AB 


. int dw loopiint x, int y 


2 Í 


, int n; 
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3 do 1 

4 X += П: 
5 y *- n 
8 n--; 

1 


} while ((n > 0) & (y < n)); /* Note use of bitwise '&' */ 
return x; 


) 
GCC P4 f T s HM CASA. 


Initially x, y, and n are at offsets 8, 12, and 16 from $ebp 


[Иа] DC 


1 movl 8{%ерр],%ев1 

2 movl 224%сБр),Ферх 

3 movl 6 {%ерр) , %есх 

4 арда! ап 4,,7 inserted {о optimize cache performance 
5 16; 

5 imull &ecx,ebx 

É addi %есх,%ез1 

8 deci $ecx 

9 testl Жесх,Фесх 


10 setg wal 
11 cmpl %есх,%еһх 
12 setl +91 
23 andl Sedx, Ұсах 
74 testb 51,%а1 
15 jne 216 
А. 创建 一 个 寄存 器 使 用 表 ， 类 似 于 图 3.13 (b) 中 所 示 的 那个 . 
B. Jah CRAP M test-expr 和 body-statement， 以 及 汇编 代码 中 相应 的 行 ， 
C. 对 汇编 代码 添加 一 些 注释 ， 描 述 程序 的 操作 ， 类 似 于 图 3.13 (5) 中 所 示 的 那样 ， 
while ЇЙ 
while 诗句 的 通用 硼 式 是 这 样 的 ， 
while (test-expr) 
body-statement 


E 3 do-while 的 不 同 之 处 在 于 对 test-expr 求 值 ， 在 第 一 次 执行 body-statement 2 WT, ЖАП 


能 中 二 了， 直接 翻译 成 使 用 goto 语 匈 的 形式 就 是 
loop: 
t = lfest-expr; 
if {lt} 
goto done; 
body-statement 
goto тоор; 
done: 


这 种 翻 兰 要 求 内 循环 ， 也 就 是 执行 次 数 最 多 的 代码 部 分 ， 里 有 两 条 控制 语句 。 相 反 ， 大 多 数 C 
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НА Б ТШЕК do-while (ЕЖ, Н-ТЕНФОХЖЕН ЕНЕ RI И ИЛ ДИТ: 
if (ltest-expr) 
goto done; 
do 
body-statenent 
while (fest-expr] : 
done: 
然后 ， 这 段 代 砂 可 以 转换 成 带 goto 语句 的 代码 ， 
t = fest-EXpr; 
1E :'t] 
geto done; 
loop; 
body-statement 
т = festexpr; 
itf it} 
qcto loop; 
done: 


作为 一 个 例子 ， 图 3.14 给 出 了 一 个 用 while 循环 来 实现 Fibonacci FFAlrACIISER (а). ЖЕ. 
XX OK PRATO HATE F (vall Fava) ЖД. ЖИЕ С fib. м goto (b) ЖЕҢ Y RRR R h 
何 翻译 成 汇编 的 ， 而 《cy 中 的 汇 纺 代码 非常 接近 于 fib м goto 中 的 СЫ. ЖЕНТ T ILAJE 
WARA. uU ELTE goto 1919 (b) 中 看 到 。 首 先 ， 编 译 器 不 是 使 用 稚 量 ;作为 循 下 变量 并 县 二 
ЕЯ ЕРУ 站 做 比较 ， 而 是 引入 了 一 个 新 的 称 为 “nmi” 的 循环 变量 ， 与 原来 的 代码 相 比 ， 
ЕНИ Т n-i 这 使 得 编 详 器 只 用 二 个 寄存 器 作为 循环 变量 ， 而 不 用 四 个 。 其 次 ， 它 将 最 原始 
的 测试 条 件 ti «n? 优化 成 了 《val en, AA RI val 的 初始 值 都 是 1。 这 样 一 来 ， 编 详 器 就 能 完全 
开除 变量 i 了。 纺 详 器 毅 常 利用 变量 的 官 始 值 来 优化 初始 的 测试 ， 不 过 这 使 得 解读 汇编 代 妈 有 点 麻 
烦 。 第 一 ， 为 了 循环 的 连续 执行 ， 要 保证 i <n， 这 样 编译 器 就 能 假设 nmi 是 非 负 的 了 。 因 此 ， 它 就 
НЕҢ nmi ! = 0 ПА K: nmi >= ОЕА ЖАНА). ХНИК ІІ ABO. 


练习 是 3.11 
мәкан С АҚ), 

1 int loop whileíint a, int b) 
2 { 

3 int i = 0; 

4 -nt result = a; 

5 while {1 < 255) Í 
5 result += a; 

7 a -= b; 

8 1 += b; 

9 | 

10 return result; 
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GCC 产生 这 样 的 汇编 代码 ; 


Initialiv a and b are at offsets 8 and 12 from ebp 
rovl 8 (%еБр), %еах 
movl 121!*5ebp],tebx 
xorl %есх,%есх 
rovl Феах, %edax 
.p2align 4, , 7 

.І5: 
addl %еах,%ейх 
subl &ebx,$eax 
addl *ebx,t$ecx 
cmpl 5255, есх 

11 jle .L5 


A. 创建 一 个 循环 体内 的 害 在 器 使 用 表 ， 类 羽 于 图 3.]4 Cc) 中 所 示 的 那 一 个 。 

B. 指出 C 代码 中 的 test-expr 和 body-statement， 以 及 汇编 代码 中 相应 的 行 ，C 编译 器 对 初始 测 
试 进行 了 什么 优化 ? 

C. 对 汇编 代码 添加 一 些 注 释 ， 描 述 程序 的 操作 ， 类 似 于 图 3.14 (c) 中 所 示 的 那样 。 

D. (ACHE) S — AF8 рою АЖ, 它 的 结构 类 似 于 江 编 代码 的 结构 ,就 像 图 3.14 (b) 
中 所 做 的 那样 . 


uD cm <<] о їл gm бы Bo — 


= 
sa) 





—— —. co0de/asm/hib.c 
] int fib м gotoíint n) 
z Í 
3 int val = 1; 
— —  —— Modelasmffib.e 1 int nval = 1; 

D int fib w(int n) Й Ы 

204 | | 7 if (val >= n) 

3 imt 1 = 1; 8 goto done; 

4 int val - 1; g nmi - n-]; 

5 int nval - 1; 10 

6 11 loop 

7 while (1 < n) 1 12 t = уа1+пуа!; 

H int t = vai4nvàl:; 13 val = nval: 

9 val = nval: 14 nval - t; 

10 nval = t; 15 nmi--; 

-1 in; 15 if (nmi) 

12 } 17 goto loop; 
18 

- 19 done: 

-4 return val; 2D return vai; 

15 } 21 ) 

9 caderasm/fib.c e — code/asmfib.c 


(a) C (t 88 (b) 与 之 等 价 的 goto 版 本 





图 3.14 
(HEC, 些 优 化 ， 包 括 用 一 个 我 们 称 为 nm 的 变量 民 蔡 蛮 最 i 的 值 ， 


for ЙН 


WU 中 


for ҖИРЕН é yk, F: 22 HE 


for (init-expr; test-expr; update-expr) 


body-statement 
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movil 
movl 
movl 
cmpl 
уде 
leal 
‚110: 
leal 
movl 
movl 
decl 
jnz 
L8: 


8rt&obp),€*eax Get n 
Sl1,t*ebx Set vai to 1 
S1,*2ecx Set пуаі to і 
eax, ebx Compare val:n 
‚19 If >= goto done 
-li€eaxj, *edx nmi = п-і 
loop: 
(&ecx,tebx],teax Compute t = nval-«val 
Фесх, ebx Set val to пуа] 
зеах, $ecx Set nval to t 
$edx Decrement nmi 
.Һ10 if іш 0, goto loop 
done +: 


(c) 对 庶 的 汇编 语言 代码 


Fibonacci Bj while mea Ba C 和 汇编 代码 


C iB ab EUER, RA DRGUE РЕА Pte R while 箱 环 的 代码 的 行为 一 样 ， 


mnit-expr; 

while tifest-expr) | 
body-statement 
update-expr; 

} 


也 就 是 ， 程 序 首 先 会 对 初始 表达 式 initexpr ЖӨН. RDRAM ТАЛЫНАН test-expr 
求 值 , 如果 测 试 结果 为 很" 就 会 退出 ,然后 换行 循环 体 body-statement, 最 后 灶 更 新 表达 式 update-expr 


求 值 。 


这 段 代 码 编译 后 的 形式 是 基于 前 面 讲 过 的 从 while 到 do while 的 转换 的 ， 首 先 给 出 do-while Ж 


AX 


init-expr; 
lf ('test-expr) 
goto done; 
do í 
body-statement 
apdate-expr; 
} while (test-expr) ; 
done: 
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然后 ， 将 它 转换 成 goto 代码 : 


inij-expr; 
t = test-expr; 
if (1т) 


goto done; 
loop: 
body-statement 
update-expr; 
t = fest-expr; 
if it] 
goto lcop; 
done: 


作为 -个 示例 ， 下 血 这 段 代 码 给 出 了 个 使 用 名 5 循环 的 Fibonacci E ЖИК: 


——— — T —— vode/asmvfib.c 
1 int fib ftint n) 
2 { 
1 int 1; 
4 int ма] = 1; 
5 int nval - 1; 
6 
7 for [1 = l; 1 < rj; i++) í 
a int t = val-snval: 
E val - nval; 
18 nval - t; 
11 ) 
12 
13 return val; 
l4 } 
—.——. code/asnyfib.c 


将 这 段 代码 转换 成 while ТЁК S SURG (093 55 BE 3.14 TAHRA fib ow 的 代码 一 样 。 实 际 
E, СССХТИ АЙ E RE AR EGER E HERE 
练习 题 3.12 
考虑 下 面 的 汇编 代码 ， 
Inttialiy x, y, and n are offsets 8, 12, and 16 from %ebp 


mcvl %ерх,%есх 
imull 121%ерр) , Фесх 


1 movl 8í(S&ebp],$€ebx 
2 movl le[*ebp),S&edx 
3 xori %еах,%еах 

4 decl *edx 

5 15.14 

6 

T 
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8 .p2aliga 4,,7 Inserted to optimize cache performance 
9 „16; 

10 addl %есх,%еах 

11 subl %=bx,*edx 

12 jns .L6 

13 .L4: 


前 面 的 代码 是 编译 下 面 形式 的 她 代码 得 到 的 ， 
int loopí(int X, int y, int n] 
i 
int result = 0; 
int i: 





1 
2 
3 
4 
5 "or (1 = i iils 0 ) Í 
6 result += 

1 ) 

8 return result: 

9 


) 
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REFALAS C np ACRES. TIKA t HEC ICI IR. MIL TS. BA 
结果 是 放 在 寄存 器 W%eax 中 返回 的 ， 为 了 解决 这 个 问题 ， 你 可 能 需要 对 寄存 器 的 使 用 进行 一 点 猜测 ， 


然后 看 起 这 些 猜 测 是 否 合理 . 
А, 程序 值 result 和 i 应 该 放 在 哪些 害 存 器 中 ? 
B.i 4304648 & $ y? 
C.i 的 测试 条 件 是 什么 ? 
D. 是 如 何 更 新 1 的? 


E. 描述 如 何在 反 环 体内 增加 result 的 己 表 达 式 ， 不 会 在 一 次 循环 到 下 一 次 循环 之 间 收 变 其 慎 ， 


编译 器 发 现 了 这 个 情况 ， 将 它 的 计算 移 到 了 循环 之 前 。 这 个 表达 式 是 什么 ? 


F 335 # С Kani А р. 
3.6.5 switch Ед] 


switch (HK) 语句 提供 了 根据 一 个 整数 索引 值 进行 多 重 分 支 (multiway branching) 的 能 力 。 
全 处 理 基 有 多 种 可 能 结果 的 测试 时 ， 这 种 语句 特别 有 用 。 它 们 不 充 提 高 了 C 代码 的 可 读 性 ， 而 且 通 
过 使 用 -种 称 为 跳 转 表 (jump table) 的 数据 结构 使 得 实现 更 加 高 效 。 跳 转 表 是 一 个 数组 ， 表 项 ; 是 
一 个 代码 段 的 地 址 ， 这 个 代码 费 实 现 的 是 当 开 关 索 引 值 等 于 i 时 程序 应 该 采取 的 动作 。 程 序 代码 用 
并 关 索 引 值 来 执行 一 个 跳 转 开具 的 数组 引用 ， 确 定 跳 转 指令 的 目标 。 久 使 用 一 组 很 长 的 让 else 语句 
相 比 ， 使 用 跳 转 表 的 优点 是 执行 开关 语句 的 时 间 与 开关 情况 【switch cases) 的 数量 无 关 。GCC 根据 
开关 情况 的 数量 和 开关 情况 值 的 稀少 程度 〔sparsity } 来 翻译 开关 详 句 。 当 开关 情况 数量 比较 多 о 


如 ， 四 个 或 更 多 )， 并 且 值 的 范围 跨度 比较 小 时 ， 就 会 使 用 跳 转 表 。 


图 3.15 (a) 给 出 了 一 个 C switch 语句 的 示例 。 这 个 例子 有 些 非常 有 意思 的 特征 ， 包 括 情况 标 
= (case labels》 是 不 连续 的 {对 于 情况 101 81105 是 没有 标号 的 )， 有 些 情 况 有 多 个 标号 《情况 
104 和 106)， 而 有 些 情 况 则 会 落 入 其 他 情况 〈 情 况 1027， 因 为 对 应 该 情况 的 代码 段 没 有 以 break 


语句 结尾 。 
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code/asm/switch.c 
/* Next line is not legal C */ 
code *j4t[7] = í 
loc А, loc def, loc B, loc с, 
loc D, ioc def, loc D 


1 

2 

3 

d 

^ Р; 
5 

7 int switch eg implíint x) 
B 


1 
5 a4nsigned xi = x ~ 100; 
— — — —rüde/asm/switch.c 12 int result - x; 
] int вмісеһ egíint x] 11 
2 Í 12 if ixi > 6) 
1 int result - x; 13 goto loc def; 
z 14 
5 switch (x) Í 15 Р Next goto 15 not legal C */ 
6 15 goto 3jt[xi]; 
1 case 100: 17 
8 result *= 13; 18 loc А: /* Case 100 */ 
9 break; 19 result *z 13; 
19 20 goto done; 
11 case 102: 21 
12 result += 10; 22 1Іос B: /* Case 102 */ 
13 /* Fall through */ 23 result += 10; 
14 24 /* Fall through */ 
"5 case 103: 25 
16 result += 11; 26 loc_C: /* Case 103 */ 
17 oreak; 27 result += 11; 
18 29 goto done; 
_9 case 104: 29 
20 case 106; 30 loc D: /* Cases 104, 106 */ 
21 result *- result; 31 result *- result; 
22 break; 32 goto dono; 
23 33 
24 default: 34 loc def: /* Default case */ 
25 resul- = 0; 35 result = 0; 
26 } 36 
27 3/ done: 
28 return result; 38 return result; 
29 } 39 } 
—— code/asm/switch.c 一 -一 一 一 —— cade/asm/switch.c 
(a) switch ШЇ, (h) 305 ECOSSE 


3.15 switch 语句 示例 以 及 到 扩展 C 的 翻译 
513 7 C Cextended С) ӨНЕРІН ГЕНЕ A je Ms, АЛАЯ. ЗС СА АЛҒАНША ТЫЙУ. 
图 3.16 ЖА BE switch, eg БГ" ЕШ AR C RRR RT AR CRT REA ERRA E A 3.15 
(b) 中 的 过 程 switch_eg_impl。 我 们 说 “扩展 的 ”是 因为 C 本 身 并 不 提供 支持 这 种 跳 转 表 所 天 的 结 
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Қ, НЕКЕ TESA С. 98 RETE. BROTSE МЕНДЕ. And. 
我 们 扩展 了 C， 增 加 了 数据 类 型 code。 


£d M p 


ca ~] & г 


20 


Set up the jump table access 
lea. -100(tedx),$eax 
cmpl 56, %еах 

ja .LY 

jmp *,110(, Феак, 4} 


Case 100 


„LÉ: 


leal (%edx, ,%edx,2) %eax 
leal (Фейх, еах, 4), жедх 
jmp .L3 


Case 102 


L5: 


addl 510, едх 


Саѕе 103 


LB: 


addl 511,%ейх 
jmp .L3 


Cases 104, 106 


‚18: 


imull Фейх, едх 
jmp .14 


Default case 


L3; 


xori $*edx,tedx 


Return result 


Li: 


movl Фейх, %ёах 


Compute xi = x-100 
Compare хї:б 

if >, poto ос def 
Goto jt] xij 


юг Ат 
Compute 3*x 
Compute x -4*3*x 
Goto done 


loc FH: 


result += I0, Fall through 


oc C: 
result += IÍ 
Goto done 


loc_ D: 
result *— resuit 
Сето done 


loc def: 


result = 0 


done: 
Set result as return value 


图 316 Bj 3.15 ф switch 语句 示例 的 汇编 代码 


第 1-4 行 建立 起 了 咒 转 表 的 入 口 。 为 了 保证 当 x 的 值 小 于 100 sk KT 106 时 会 执行 default JF 
关 情 六 指定 的 计算 ， 代 码 上 生成 了 一 个 等 于 x-100 的 无 符号 人 м. XE ТЛ T 100—106 2 (8108 x ЖИН, 
xi МЕ 0-6 之 何 ， 因 为 x-100 Е ЗЕЕ КИЛУ. НЕ, Sakro, RE 
用 (а ОТЕ ХО 指令 来 距 转 到 默认 开关 情况 的 代码 。 H jt KERER RIBed THERE. 
ЕРЕН ЖЕЛІ xi 处 的 地 址 。 注意 ， 这 种 形式 的 вор 不 是 合法 的 CC 语句 。 上 指令 4 ШІК ЕНІН 
表 中 茶 个 表 项 的 转 称 。 因 为 是 间接 跳 转 ， 目 标 是 从 存储 器 中 读 出 的 。 读 的 有 效 地 址 是 由 标号 .上 L10 指 
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是 的 基地 址 加 上 变量 xi. 放 在 寄存 器 名 eax MO ARRA RATAA 4, МАБ K B RET ЛІ 
йй 4 FS) sm. 
(EIL CB, Bip UTD F BOX USB AR. RRT EUH 


1 Section .rodata 

2 .align 4 Align address to multiple of 4 
3 D10: 

4 .long .L4 Case 100: іос A 

5 long .L9 Case 101: loc. def 

6 .long .L5 Case 102: loc. B 

7 long .L6 Case 103: loc. C 

9 .long .L8 Case 104: іос Р 

9 .long .L3 Case 105: loc. def 

10 .long .L8 Case 106: ioc. D 


igk tb B BH BH, ТЕШ ".rodata" (Kos “НЕЙ ЕЕ”, “Read-Only Data? ЙН КЕКЕНЕ 
中 ， 应 该 月 一 组 了 个 “长 * 宇 (4 个 学 节 }， 每 个 宁 的 值 部 是 与 指定 的 汇编 代码 标号 (例如 ，.,L4) 
相关 的 指令 地 址 。 标 号 .Li0 标 志 着 这 有 段 分 配 的 起 如 。 与 这 个 标号 相对 应 的 地 址 会 作为 间接 跳 转 ( 指 
54) 的 基地 址 。 

f switch eg impl 中 【图 3.15 (2), А5 10с A 开始 ， 一 直到 loc_D A loc_def 的 代码 块 ， 
SEXE switch 语句 的 五 个 相合 的 分 支 ， 可 以 观察 到 ， 当 x 超出 100 一 106 范 者 时 【初始 范围 检查 》， 
或 者 当 它 等 于 101 或 105 时 《根据 跳 转 才 )， 都 会 执行 标号 为 loc_def HREH. 5 00 loc_B 
的 牧 码 块 是 如 何 落 入 标号 为 loc_C 的 代码 块 的 。 


练习 是 3.13 
АТСА, ЖАПА Т switch 语 向 的 主体 ， 在 妆 代 础 中 ， 开 美 情况 标号 【ease labels ) 
是 不 连续 的 ， 而 有 些 情况 还 有 多 个 标号 ， 
int swiLlch2í(int xi! | 
int result - 0; 
switch [x] + 
/* Body of switch statement omitted */ 


} 
return resu.t: 


® ЕН. GCC 为 程 库 的 初始 部 分 以 及 跳 转 表 生 成 了 王 面 这 样 的 汇编 代码 ,变量 双开 始 时 
是 位 于 相对 于 寄存 器 品 ebp 偏 移 量 为 8 的 地 方 ， 


Jump table for switch? 
1 „LIL: 
2 .long .L4 
Setting up jump table access 3 .long .L10 
1 movl 8(*ebp),$eax Retrieve x 4 .long .L5 
2 addl $2,%еах 5 .long .L6 
3 cmpl $6,*eax 2 .long .L8 
4 ja .110 7 long .L8 
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5 jmp *.Llií,teax,4) 8 long .L9 
根据 前 面 的 信息 来 回答 下 列 问题 : 

А. switch 语句 体内 的 开关 情况 标号 的 值 是 多 少 ? 

B. C 代码 中 哪些 开关 情况 有 多 个 标号 ? 


37 ЧЕ 


“个 过 程 调用 包括 将 数据 ‘以 过 程 参 数 和 返回 慎 的 形式 ) 和 控制 从 代码 的 一 部 分 传递 到 男 一 部 
分 。 另 外, 它 还 必须 存 进 入 时 为 过 程 的 局 部 变量 分 各 空间 ， 并 在 进出 时 释放 这 些 空间 。 大 多 数 机 器 ， 
包括 IA32， 只 提 具 简单 的 转移 控制 到 过 程 和 从 过 程 中 转移 出 控制 的 指令 。 数据 传递 、 局 部 变量 的 分 
了 和 释放 是 通过 操纵 程序 禄 来 实现 的 。 


371 Б 

IA32 程序 用 程序 栈 来 支持 过 程 调用 。 栈 用 来 传递 过 程 参 数 、 存 储 返 回信 息 、 保 他 寄存 器 以 供 以 
后 惊 复 之 用 ， 以 及 用 下 本 地 存 情 。 为 单个 过 框 分配 的 于 部 分 栈 称 为 栈 幅 (stack frame). |8 3,17 $82 
栈 巾 曲 通用 结构 。 栈 帧 的 最 质问 是 以 两 个 指针 定 界 移 ,寄存器 ebp 作为 帧 指针 ， 而 寄存 器 %esp 
作为 栈 将 针 。 当 程序 执行 时 ， 乒 指针 是 可 以 移动 的 ， 因 此 大 多 数 信息 的 访问 都 是 相对 于 帧 指 什 的 。 

Бъ Р (WAA) ЛЕ О 《被 调用 者 )。Q 的 参数 放 在 P TUE. УК, A P DH] Q 
时 ，P 牛 的 返回 好 第 被 压 入 栈 中 ， 形 成 正 的 乒 帧 的 末 昆 ， 返 同 地 直 就 是 当 查 序 从 站 返 回 时 庶 该 继续 
执行 的 地 方 。 昌 的 栈 帧 从 保存 的 帧 指针 的 值 (例如 ，%ebp) 开始 ， 后 徊 是 保存 的 其 他 寄存 器 的 值 。 

过 程 龟 也 用 栈 来 保存 其 他 不 能 有 放 在 寄存 器 中 的 局 部 变量 。 人 这 样 敌 是 因为 ; 

. 寄 作 器 不 够 存放 所 有 为 局 部 变量 

. ”有些 局 部 变量 是 数组 或 结构 ， 因 此 必须 通过 数 维 或 结 移 引 用 来 访问 。 

° 要 对 一 个 局 部 变量 使 用 地 址 操作 符 “ 访 ” 因此 我 们 必须 能 够 为 它 产生 一 个 地 址 。 
JE), Q 会 用 醒 帆 来 存放 它 调用 其 他 过 程 的 参数 ， 

正如 前 面 讲 过 的 那样 ， 栈 向 低地 址 方向 增长 ， 而 栈 指 计 %esp 指向 栈 硕 元 素 。 可 以 通过 push 和 
рор! 指令 将 数据 存 入 栈 中 和 从 栈 中 取出 。 可 以 通过 将 本 指 和 寺 的 值 减 小 适当 的 什 来 分 配 没 有 指定 初始 
值 前 数据 的 空间 。 类 似 地 ，9] 以 通过 增加 栈 指 针 来 释放 空间 。 


3.7.2 ”转移 控制 
下 表 给 出 的 是 支 持 过 程 调 用 和 返回 的 指令 ， 


call Label 过 程 调用 


call *Оретала | HARAR 
leave 为 返回 准备 栈 
ret 从 过 程 调 由 中 返回 





call 指令 有 一 个 日 标 ， 指 明 被 调用 过 程 起 始 的 指令 地 址 。 同 跳 转 . 样 ， 调 用 可 以 是 直接 的 ， 也 
可 以 是 间接 的 。 在 应 编 代码 中 ， 丰 接 调 用 的 日 标 是 -个 标号 , 而 间接 调用 的 目标 是 * 后 面 跟 一 -个 操作 
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数 指示 符 ， 其 语法 与 movl 指令 的 操作 数 的 语法 相同 (图 3.32. 
kg 


He Ауд 
| 
ndum K: 
rá-- dn 
| LIES 
+8 参数 1 | 
+4 返回 地 寺 , 
тан < 
фер laid еър 
-4 
ЖЕТЕН EIER 
Ane RR 
9:3 当前 帧 
— 
esp 





ETA 


图 3.17 Tu 
ЊК, ТВЕА а. ТТВ. ШИЛ КИЕВЕ. 


call З ЈА ЖЕНЕН ИШ A ВЕ, ЖӘНЕН ЧЕ ДЕКА. БЕЛЕЕ НИСЕ РЕ l 
call 后 徊 的 那 条 指令 的 地 址 , ХВЕ 388 Н ИЕ ЛАП, 执行 会 从 此 继续 。ret FOAR PSA ДАЕ, 
FRANA. EATER RES, WERE АР, RISTET oA сай $82 4T aje 
地 址 的 位 置 。]Jeave T8 n] ДЯ) Ж Н REES. CSF ERRET]: 

1 movi &ebp, %евр Set stack pointer to beginning of frame 


2 popi жер Restore saved ФеВр and set stack ptr 
to end of caller's frame 


RB BA SS S: ЖТ: 145 


УК, RAME LIFE n LUE ECHCTE H] ШАЛА i BERTE 
AE (rs вах пр RETHA. fu OE FE SEE TA 


练习 题 3.14 

下 而 的 代码 片断 常常 出 现在 库 泡 带 的 编译 版 本 中 ，; 
1 call rext 

2 next: 

4 popl *eax 

А. FAR %еах ER, ТАЛА? 

B. 解释 为 什么 这 个 调 用 没有 匹配 的 rel 指令 。 

C. 这 段 代 码 元 成 了 什么 功能 ? 


3.7.8 寄存 器 使 用 惯例 

种 序 寄存 器 组 是 惟一 一 个 被 所 有 过 程 具 享 提 资源， 虽然 在 给 定时 刻 只 能 有 一 个 过 程 是 活动 的 ， 
BDP ANSI W -个 了 过程 【调用 者 》 调用 另 -- 个 (被 调用 者 ) М, БЕНЕН ТАНАН 
后 会 使 用 的 寄存 器 的 值 。 为 此 ，IA32 来 用 了 一 组 统 -的 寄存 器 使 用 惯例 ， 所 有 的 过 程 都 必须 遵守 ， 
包括 程序 库 中 的 过 程 ， 

ЖЕМІ, ЯЛҒА Феах. meds Ж%есх 被 划分 为 调用 者 保存 Ccaller save) ЖЕ. ЧАН P 
调用 ОН. Q 可 以 覆盖 这 些 寄 人 存 器 ， 而 不 会 破坏 任何 P 所 需要 的 数据 。 另 外 ， 寄 存 器 %ebx、%esi 
Хед 被 划分 为 被 调用 者 保存 (callee save) 寡 存 器 。 这 意味 着 只 必须 在 覆盖 它们 之 前 ， 将 这 些 寄 
在 器 的 值 保 存 到 栈 中 ， 并 在 返 末 前 恢复 它们 ， 因 为 P【 或 某 个 更 高 层次 的 过 程 ) 可 能 会 在 今后 的 计 
算 中 幅 要 这 些 值 。 此 外 ， 衫 撕 这 里 描述 的 惯 鲍 ， 必 须 保 持 寄 存 器 莞 ebp HI%esp. 


旁 注 ， 为 什么 出 做 “被 调用 者 保存 ”和 “ 讲 几 者 保存 ”? 

者 处 下 面 这 个 场景 : 

int P() 

| 
int x = Ғ();  /*Somecomputation */ 
90; 
return x; 

} 


过 程 了 希望 它 计算 出 来 的 x 的 值 在 调用 了 ОЗ АЯЙ. PX x 放 在 一 个 调用 者 保 奉 赛 存 器 
中 ， 而 P (调用 者 ) 必须 在 调用 Q 之 蔚 保 存 这 个 值 ， 并 在 四 运 国 后 护 复 该 值 如果 工 在 一 个 被 调用 
者 保存 寄存 器 中 ，Q ( 被 调用 者 ) 想 使 用 这 个 寄存 器 ， 那 么 Q 在 使 用 这 个 害 存 器 之 前 ， 站 须 保存 这 


个 值 ， 并 在 返回 前 恢复 它 。 在 这 两 种 情况 中 ， 保 存 就 是 将 害 存 路 慎 压 入 栈 中 ， 而 恢复 是 指 从 栈 中 强 
H3 39 53, 7 


Е, ЖШ РЕХАН. 
1 int Piint х) 

2 Í 

3 int y = x*X; 
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1 int z = Qiy); 
5 

6 reLurn y + b; 
10) 


过 程 P 在 调用 日 之 前 计算 y, НЕСЕ E у 的 值 在 总 返回 后 是 可 用 的 。 有 两 种 方式 可 以 做 
到 这 一点; 

4 它 可 以 在 调用 站 之 前 ,将 y 的 值 存放 在 自己 的 栈 帧 中 ;， 当 息 返 国 时 ， 它 可 以 从 栈 中 取出 
的 值 。 

* ЕНИМУ 的 值 保存 在 被 调用 者 保存 寄存 器 中 。 如 果 怠 ， 或 任何 其 他 站 调用 的 程序 ， 想 使 
用 这 个 宕 存 貂 ， 它 必须 将 这 个 苛 存 器 的 值 和 保存 在 栈 帧 中 ， 并 在 返回 前 恢复 该 值 。 因 此 ， 妆 
Q 返回 到 PP 时, y 的 值 会 在 被 调用 者 保存 寡 存 器 中 ,或 者 是 因为 寡 存 路 根本 就 没有 改变 ， 或 
者 是 因为 它 被 保存 并 恢复 了 。 

最 常见 的 是 ，GCC 和 使用 后 一 种 方法 ， 因 为 它 会 尽量 减少 写 和 读 栈 的 次 数 ， 


练习 3.15 

下 面 这 段 代码 出 现在 GCC 为 一 个 C 过 程 产生 的 汇编 代码 的 前 部 ， 
pushl $edi 

pushl Феѕі 

pushl ерх 

mavl 22а (%ерр)}, %еах 
imull 16 (%#ерр), %еах 
mov] 24(%ерр), ерх 
lea: 0{,*еах, 4), %есх 
addl 8 (%ерр), жесх 
movl ерх, %ейх 


RDA, АЙ ЛАЛ (Фей. Феѕі жФек) RAITRE. 然后 程序 会 修改 它们 ， 以 
ХАЛЕЛ А ES hear, Фесх de Фейх), AES E, Ж рор! 3 $ Фев. сы 和 人 ebx， 
而 其 他 三 个 寄存 器 就 保持 修 故 过 的 状态 ， 

请 解 沟 这 种 在 保 店 和 恢复 寄存 回 状 态 中 明显 的 矛 后 ， 

374 过 程 示例 
作为 一 个 示例 , 考虑 图 3,18 中 定义 的 C 过 程 . 图 319 Zr HT XW P ERE ESL Е, swap, add 


从 caller КИ ТЫ eie t 8, 这些 参 数 的 位 置 的 访问 都 是 相对 寺 寄 存 器 %ebp 中 的 帧 指针 的 。 帧 
左边 的 数字 表示 相对 于 帧 指针 的 地 址 偏 移 ， 


Loa 


uo CD -—] c іл Шы e F. 


codelasm/swapadd.c 
int swap add[int *xp, int *ур) 
{ 
int x = *xp: 
int y = *yp; 


т un d; d Мм) LL 


*хр = y; 
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! хур = Xj 
B8 return x + y; 
9 } 
10 
11 int calleri! 
12 ił 
13 int агай = 534; 
14 int argz = 1057; 
15 іп, sum = swap, addí(&argl, &argZ]; 
16 int diff = argl - arg2; 
17 
18 return sum * diff; 
19 ] 
— code/asm/swapadd.c 
图 318 ”过 程 定义 和 调用 的 示例 
{19 9 
"m swap add 之 前 Ќамар ada itp 






Фер — 4 


保存 的 šebo 


БЕН 


Жеар ———» lË 









帧 指针 Зерр----ы 0 


219 caler Жі swap. сас Wiik 
МІН swap add 从 caller HHW TE HEREN , 


анар add [JEE M 
БН tesp 一 — -4 


caller 的 栈 帧 包 扰 局 部 变量 агрі Rlarg2 的 存储 ， 其 位 置 相 对 于 帧 指针 是 -8 和 -4。 这 些 变 量 必须 
存在 栈 中 ， 因 为 我 们 必须 为 它们 产生 地 址 。 接 地 来 的 这 段 来 自 ealler 编 详 过 的 汇编 代码 显示 出 它 是 
如何 调用 swap. add 的 。 


Calling code in caller 


1 leal -4{%ерр},%еах Compute &arpZ 

2 pushl &eax Push &argZ 

3 leal -8(%ерр),%еах Compute &arg! 

4 pushl Жеах Push &arg! 

5 call swap, add Call the swap. add function 


ЗЕ, АРЫЦИЯҚКАЕНЫЯҒЫ arg? 和 arg! 的 地 址 {用 leal 65), MO ETRIEA Тт. Ж 
后 其 调用 swap. add. 


swap add 编 详 过 的 代码 有 三 个 部 分 :“ 建 立 ” 部分， 初始 化 栈 帧 :“ 主 体 ” 部 分 ， 执 行 过 程 的 实 
И: 结尾” 部 分 ， 恢 复 栈 的 状态 和 过 程 返回 。 
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TIE swap add HEVA. MA k cal f eem ps SER Am. 


Setup code in swap. add 


1 Swap add: 

2 pushl &ebp Save old %ebp 

3 movl sesp,%ebp Set Ферр as frame pointer 
4 pushl &ebx Save ерх 


了 过程 swap add 需要 用 寡 存 器 %ebx ЕЛШЕ (ph. АХ Е ЛЕ АЛ] A Bay eds, D 
将 旧 伍 作为 栈 帧 建立 的 一 部 分 卜 六 栈 中 。 
Pri swap add (3 ҚЫШ; 


Body code in swap. add 


5 movl 8 (%ербр), едх Get хр 

Б тоу 12{%сБр),%есх Get ур 

7 movl (*edx),$ebx Get x 

g movl {%есх),%еах Get y 

9 movl Феах, (Фейк! Store y at *xp 

10 movl ерх, |Зесх) Store x at *yp 

11 addl &ebx,€eax Set return value = x+y 


这 段 代 码 从 caller jt EE НК ЖЖ. PRA REEF CLERI T. MESRA A 8 125 MUR 
对 于 %ebp 的 旧 什 的 位 置 - 12 和 -6 移 到 了 相对 于 免 ebp 的 新 值 的 位置 +12 М8, TES, BRE x Hy 的 
和 是 存放 在 寄存 器 %eax 由 作为 返回 值 传 道 的 。 

КІН swap add 的 结尾 代码 ; 


Finishing code in swap. add 


12 popl Sebx Restore ерх 
13 movl %ebp,%esp Restore бсезр 
14 popl %ерр Restore ebp 
15 ret Return to caller 


ЖЕКПЕ А ерх. wesp ЖІФерр (ИШ. Ж Ет ret 指令 ,注意 ， 吕 以 用 一 
Ж leave 指令 代 蔡 指 令 13 和 14。 不 同 版 本 的 GCC 对 此 可 能 会 有 不 同 的 习惯 ， 
КЕМ caller 中 的 代码 紧 跟 在 调用 swap, add 的 指令 后 面 ， 


б movl Фаах, жейх Resume here 


M swap add 返回 时 ， 过 程 caller SARAR 9 JT 38 ЕТ. 注意, 这 条 指令 将 返 问 值 从 %eax 
BS ^e. 


5k 2] Mi 3.16 


1 int procivoid] 

2 Í 

3 int Х,У; 

4 асапЕ("%х %х", Бұ, &x); 
5 relurn x-y; 

6 
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GCC 产生 下 面 这 样 的 汇编 代码 : 


proc: 
pushl Ф%ерр 
movl *esp,*ebp 
subl 524,%евр 
addl 5-4, %esp 
leal -4(%ерр), %еах 
pushl eax 
leal -В{%ерр)},%еах 
pushl %еах 
Ü pushi 8.2020 Pointer to siring "ox "ex" 
1 call scanf 
Diagram stack frame ai this point 
12 movl -Bitebpl,$eax 
13 movl -4($ebp),tedx 
14 subl *eax,$edx 
15 movl €edx,£eax 
16 movl €ebp,t*esp 
17 popl $ebp 
18 ret 


假设 过 程 proc 开始 执行 时 ， 寄 在 器 的 值 如 下 ; 


= m iD CO -] Ch цб. de g— 






Qx800040 
(x800060 x 





假设 proc 调用 scanf( 第 LE r), 而 scant 从 标准 输入 读 入 值 0x46 和 0x53, З АФ "00x %х” 


存放 在 存储 器 位 置 Ox300070. 


А. $ 341 E. %ебр 的 值 被 设置 成 了 多 少 ? 

B. 局 部 变量 xX тун ЖЫ ЖА? 

C. # 10176 besp 的 值 是 多 少 ? 

D. 部 出 就 在 scanf 返 回 后 proc 的 栈 帧 的 图 ,请 包括 尽 可 能 多 的 关于 模 帧 元 素 的 地 址 和 内 容 的 局 息 ， 
E. 指出 proc ARA HAEA (分 配 这 些 浪 费 了 的 区 域 是 为 了 改进 高 速 绅 存 的 性 能 )。 


3.7.5 递归 过 程 


二 一 慷 中 摘 述 的 栈 和 链接 悍 例 使 得 过 程 能 够 递归 地 调用 它们 自身 。 因 为 每 个 调用 在 栈 中 部 有 它 


旧 己 的 私有 空间 ， 多 个 未 完成 调用 的 局 部 变量 不 会 相互 影响 。 此 外 ， 虐 的 原则 很 自然 地 就 握 供 了 适 
当 的 策略 ， 当 过 程 被 调用 寺 分 号 局 部 存 峙 (storage )， 当 返回 时 释放 存 情 。 


图 3.20 给 出 了 递归 的 Fibonacci Ж C 代码 。( 注 意 ， 这 段 代 码 的 效率 很 长 -一 我 们 用 它 来 作 


为 一 个 说 明示 例 ， 这 不 是 一 个 很 聪明 的 算法 ,) 完整 的 汇编 代码 如 图 3.21 所 示 。 


code/asmvfib.c 
int fib recí(int n) 


{ 


int prev,val, val: 
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4 
5 if (n <= 2] 
6 return 1; 
7 prev val = tib,recín-2?; 
8 val = fib гесіп-1); 
9 return prev val + val; 
10 ) 
3.20 递归 的 Fibonacci AFA CRE 
- fib rec: 
Setup code 
2 pustl &ebp Save old %ebp 
3 movl $esp,tebr Set Зебр as frame pointer 
4 subl 516,%евр Allocate 16 bytes on stack 
5 pushi $esi Save езі (offset -20) 
6 pushl &ebx Save ерх (offset -24) 
Body code 
7 movl 9 (%ерр), ЗеБх Get n 
8 cmpl $2,*ebx Compare п;2 
9 jle .124 If <=, poto terminate 
10 3ddl $-12,$esp Allocate 12 bytes on stack 
1] leal -2($ebx),€*eax Compute n-2 
12 pushl &eax Push as argument 
13 zal. fib rec Call fib rec(n-2) 
14 mov. *eax,$esi Stare result in Wesi 
15 add. $-12,*esp Allocate 12 bytes on stack 
16 lea. -l(*eox]),*eax Compute n-1 
17 pushl %eax Push as argument 
18 cal. fib rec Сай fib rec(n-1) 
18 add. %esl,%eax Compute val «nval 
20 jmp .L25 Goto done 
Terminal condition 
terminate: 


21 „L24: 
2 movi Sl,£€eax 


Finishing code 
23 L25: 
24 leal -24(%əbp),%esp 
25 popl Yebx 
26 popl $esi 
27 movl *ebp,tesp 
28 popl $ebp 
29 rat 

图 3.21 


Return value 1 


done: 


Set stack to offset -24 
Restore ерх 
Restore esi 
Restore stack pointer 
Restore %ebp 

Return 


3.20 中 递归 的 Fibonacci 程序 的 汇编 代码 
盟 然 代码 有 点 长 ,但 还 是 值得 仔细 研究 一 下 的 。 建 立 代 码 (第 2~6 行 ) ВЛЕ", ВЫ 


code/asm/fib.c 
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&%ерр 的 山 值 、 末 使 用 的 16 个 字 节 “、 保 存 的 被 调用 者 保存 寄存 器 和 esi 和 %ebx 的 值 ， 如 图 3.22 
AXE. Ал, OPI ерх 来 保存 过 程 参 数 n (第 7 行 )。 一 旦 满足 中 止 条 件 ， 代 码 会 跌 转 
到 第 22 行 ， 在 此 将 返回 值 设 为 1- 


р Е-е 
i SIS ki 递归 调用 前 


85 He] IF FR 


n 
4 返回 地 此 


BRI LES 


Wi TET 


iebp — —* 


tib гес ің 


fib rec 


FH MI 





图 3.22 递归 的 Fibonacci ӨНІМ 
ARE Му БКА, 右边 是 第 一 次 递 妇 调 用 之 前 的 帧 状态 。 


对 于 不 满足 中 止 条 性 的 情况 , 指令 10-12 会 进行 第 一 次 递归 调用 。 这 包 撕 在 栈 中 分 配 不 会 被 使 
Aim] 12 个 字 节 ， 人 然后 将 计算 出 来 的 值 -2 ЖАН, ЖА, БА 32 布 边 所 示 。 然 后 ， 它 会 
进行 递 妇 讽 用 ， 引 起 一 连 串 的 而 用 、 分 配 栈 巾 、 对 局 部 存储 进行 操作 ， 等 等 。 每 次 调用 返回 时 ， 它 
都 会 释放 栈 空间 ， 恢 复 所 有 被 禾 改 过 的 被 调用 者 保存 寄存 器 。 因 此 ， 当 我 们 返回 到 当前 调用 时 第 
14 行 )， 我 们 可 以 假设 寄存 器 %eax 包含 着 递归 调用 返回 的 值 ， 而 寄存 器 %ebx 包含 函数 参数 n 的 值 。 
i EB CC ЕТІН НІНЕ pev vaD 存放 在 寄存 器 %esi 中 (第 14 行 )。 通 过 使 用 被 调用 者 保存 
寄存 器 ， 我 们 能 保证 在 第 二 网 递归 调用 后 这 信 值 仿 然 是 可 用 的 。 

指令 157-17 进行 第 二 次 递归 调用 ， 它 会 再 次 分 配 不 会 被 使 用 的 12 个 字 节 ， 并 将 值 n-1 ЖАҢ 
"P. 在 这 个 谓 用 之 后 〈 第 18 行 )， 计 算出 来 的 结果 会 放 丰 寄存 器 %%eax 中 ， 市 我 们 假设 前 一 次 调用 的 
结果 放 人 在 寄存 器 狗 esi 中 。 两 者 相 加 得 到 返 问 值 (Ж 19 47). 

完成 代 但 恢复 寄存 器 和 释放 栈 帧 。 它 首先 将 槛 帧 设置 为 保存 的 %ebx 值 的 位 置 。 注 意 ， 通 过 计 
算 相 对 于 免 ebp 值 的 栈 的 位 置 ， 无 论 是 否 满 足 中 止 条 件 ， 计 算 都 会 是 正确 的 。 


2 不 清楚 为 什么 C 编 详 器 会 为 这 个 函数 在 栈 中 分 配 这 么 多 的 未 使 用 存储 〈storage)。 
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3.8 数组 分 配 和 访问 


C 中 教 组 是 一 种 将 标量 型 数据 紫 集 成 更 人 数据 类 型 的 方式 。C 用 来 实现 数组 的 方式 非常 简 单 ， 
因此 很 容易 翻译 成 机 器 代码 。C 的 一 个 不 类 寺 常 的 特点 基 可 以 对 数组 中 的 元 素 产生 指针 ， 旧 对 这 些 
指针 进行 运算 。 这 些 这 算 会 在 汇编 代码 中 番 详 成 地 址 直 算 ， 

优化 编译 器 非常 善于 简化 数组 索引 所 使 用 的 地 址 计算 ， 不 过 这 使 得 C 代码 和 它 到 机 器 代码 的 翻 
评 之 辣 的 对 应 关系 很 难 理解 。 


3.8.1 基本 原则 

对 十 数据 类 型 下 和 整 常数 N， 声 明 

Т АТМ); 
ҚУА. Ел, ЕЕЕ, NCETHNSIESEDUS, X E L Ж ЕЕН THAD CR 
лел RHA жі. НК, ESA ТЫШ А, АЛТЫН ЖЕЗ ИШНИ 
БЕН. МНЕ хь ШАНА0-М-1 之 间 的 整数 索引 来 访问 数组 元 素 。 数 组 元 素 + 
£O A x. + Li. 

作为 示例 ， 计 我 们 来 看 看 下 面 这 祥 移 声明 ， 

char AÍ12]: 

char *B[8]; 

double — C[6]; 

double  *D[5]: 


这 些 声 明 会 产生 带 卜 页 参数 的 数组 : 





数组 A E 12 个 单字 节 (char) 元 素 组 成 。 数 组 C 由 6 个 双 精 度 浮 点 值 组 成 ， 每 个 值 需 要 S 个 
Ұл. B 和 大 是 指针 数组 ， 因 此 每 个 数组 元 素 都 是 4 TE T 

IA32 的 存 悄 器 引用 指令 被 设计 用 来 简化 数组 访问 。 例 如, 假设 E 是 一 个 整数 数组 ， 而 我 们 想 计 
SED], ЖШ, E 的 地 址 存放 在 寄存 器 %edx 中 ， 而 1 存放 在 寄存 器 和 ecx 中 。 然 后 ， 指 令 


movl (%ейх,%есх,4),%еах 


ШОЛУДЫ x, as 在 该 存储 器 位 置 执行 读 操作 ， 并 将 结果 存放 人 在 寄存 器 %eax 中 。 提 水， {НҢ 
因 了 于 1、2，4 和 8 适用 于 基本 数据 类 型 的 大 小 。 


ЖЫН 3.17 
者 虑 下 面 的 声明 ， 


short 5171; 
short *T[3]; 
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short **U[6]; 
long double V]51]; 
long double *w[4]; 


填写 王 表 ， 描 还 每 个 数组 的 元 素 大 小 ， 素 小 数组 的 大 小 以 及 元 素 工 的 地 址 ; 





382 ”指针 运算 

C 允许 对 指针 进行 运算 ， 而 计算 出 来 的 从 会 根据 该 指针 引用 的 数据 类 型 的 大 小 进行 调整 。 也 误 
ER, WR p 是 一 个 指向 类 型 了 的 数据 的 指针 ，p АА х, KEA pi BÉN x+ L. b REL 
是 数据 类 型 了 的 人 小 。 

单 操 作 数 的 操作 符 此 和 * 可 以 产生 指针 和 间接 引用 指针 。 也 就 是 ， 对 于 一 个 表示 某 个 对 外 的 表达 
X Expr, &Expr 表示 个 地 址 。 对 于 表 水 一 个 地 址 的 表达 式 Addr-Expr. *Addr-Expr ÆR OR ht ria 
的 信 。 因 此 ， 表 达 式 Expr *&Expr 是 等 价 的 。 可 以 对 数组 和 指针 应 用 数组 下 标 操 作 ， 如 数组 引用 
Ali] 3 表达 式 *(A+i 是 一 样 的 。 它 计算 第 i 个 数组 元 素 的 地 址 ， 然 后 访问 这 个 存储 嚣 位置 ， 

扩充 一 下 我 们 前 面 的 合子 ， 候 设 整 数 数 组 的 起 始 了 地址 和 整数 索引 i 分 别 存放 在 寄存 器 名 edx 
和 ecx h, КД 一些 与 E 有 关 的 表达 式 。 我 们 还 给 出 了 每 个 表达 式 的 汇编 代码 实现 ， 结 果 存 放 
EATA Феах 中 。 


поті Фейх, %еах 
Е [9] 1 МІхі | movl ($edx)j, %еах 
Е[1] Р Mli] | rovl (Фейх, еск, 4), вах 


&Е[ 7] хеН | leal В{%ейх), Зеах 
E*1-1 int xgt4i-d | leal -4i$edx, tecx, 4), Феах 


* [&sE[i]«i) i Mirtti] | movl ($edx, %есх), %еах 
&E[1]-E i | movi Жесх, &eax 





企 这 些 铺子 中 ，leal 指令 用 来 产生 地 址 ， 而 mov] 用 来 引用 存储 器 (除了 在 第 -- 种 情况 中 ， 那 里 
它 是 拷贝 一 个 地 址 )。 最 后 一 个 例子 表明 我 们 可 以 计算 同 ~ 个 数据 结构 中 的 现 个 指针 之 差 , 结果 值 是 
除 以 数据 类 型 人 小 后 的 值 。 


ЖЕН 3.18 
iR ALES Eg S 的 地 址 和 整数 索引 i 分 别 存 放 在 寄存 器 名 edx 和 名 ecx 中 ,对 下 面 章 个 表达 式 ， 
给 出 它 的 类 型 ， 值 表达 式 和 汇编 代码 实现 。 如 果 钻 果 是 指针 的 话 ， 要 保存 在 才 存 器 %Eax 中 ， 如 果 是 
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ЖЖ, ЖЕЛАЛ ЕЛЖ ах Ф. 











s | р ү 
= ү | 
mem [LL 1 
= | j T — 
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ТВИН N, ЗНАТАН ad mE. ERRA Е Н ЕНЕ К. DN, 
图 3.23 (а) Т ВС decimals. RRE - H 5 个 十 进 制 数学 的 数组 表示 的 整数 。 在 把 这 
个 负数 转换 成 汇编 代 介 的 过 程 中 , 纺 译 器 产生 的 代码 类 似 于 图 3.23 COO CH PJ C AR decimal5_opt。 
站 先 ， 它 不 会 使 用 循环 变量 i, 而 是 用 指针 运算 来 依次 这 历数 组 元 素 。 它 计算 出 最 后 一 个 数组 元 素 
的 地 址 ， 并 且 把 与 这 个 地 址 的 比较 作为 循环 测试 。 量 后 ， 它 能 使 用 do-while Ж, AA ED ЕЩ, 


行 一 次 循环 体 ， 


图 3.23 (c) 中 所 示 的 代码 给 出 了 一 个 进一步 的 优化 ， 以 避免 使 用 整数 滋 法 指令 . ЖӘН, dE 
用 leal (第 5 行 } 来 计算 5*val 作为 val+4*val。 炭 后 ， 用 伸缩 因子 值 为 2 的 Ia (第 7 行 ) 使 之 扩展 


为 10*val， 
1 int decimal5[(int *x) 
2 { 
3 int i; 
á int val = 0; 
5 
5 [or {1 = Ô; 1 < b; l++) 
7 val = (10 * val) + x[il; 
B 
5 return val; 
10 } 
(a) HER) C FEES 
1 int decimal5 optí(int *x) 
2 i 
3 int val - 0; 
4 int *xend = x + 4; 
^ 
6 do | 





code/asm/decimal5.c 


Coxde/asm/decimal5.c 


code/asnydecimal3.c 
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7 val = (10 * val) + *x; 

8 X++; 

9 } while {х <= хет); 

10 

11 return ма_; 

1200) 

———K nF ————————————————- cuodeíasnvieciral3.c 
(h) 等 价 的 指针 代码 
Body code 

1 movi 9 (%ерр), *есх Get base addr of array x 

2 xorl %eax,%eax val = 0; 

3 leal 16%4%есх),%ерх xend = xtd (16 bytes = 4 double words) 

4 117: Inop: 

5 leal (Ұсах,Жеах,4),%ейх Compute 5*val 

6 movi {%есх),%еах Compute *x 

7 leal (%еах,%едх,2!,Ф%еах Compute *x + 2*[5*val) 

8 add] $4,*ecx X++ 

9 cmpl Жейх,%есх Compare x:xend 

10 уре .L12 if <=, goto loop 


(c) HR RNCS 


图 3.23 ”数组 循环 示例 的 C 和 汇编 代码 
编译 器 产生 的 代 冯 类 似 于 decimalS opt PARKERS. 


mut. 为 什么 要 训 免 使 用 整数 本 法 ? | 

在 较 老 的 IA32 处 理 器 模 裂 中， 整数 来 法 指令 要 花 资 SPA. ARRET OUR 
免 使 用 它 。 而 在 大 多 数 新 近 的 处 理 器 模型 中 ， 科 法 措 令 只 需要 于 个 时 钟 导 期 ， 所 以 不 一 定金 进 和 这 
样 的 优化 了 ， 


3.84 КЕҢ 

即便 是 创建 数组 的 数组 时 ， 数 组 分 配 和 纪 用 的 通用 原则 也 是 有 效 的 。 例 如 ， 声 明 

int A[4][3!; 

等 价 于 声明 

typedef int row3 t[3]; 

row3 t A[4]: 

数据 类 型 row3 t 被 定义 成 一 个 三 个 整数 的 数组 。 МЯ А ВЕИТ, FARRE 
12 个 字 书 来 存放 三 个 整数 所以， 总 的 数组 大 小 为 4.4 3-48 字 节 。 

数组 A 还 可 以 看 成 是 一 个 4 行 3 列 的 二 维 数组 ， 从 AOA A[3][2]。 数 组 元 素 在 存储 器 中 是 


按照 “ 行 优先 ”的 顺 厅 排列 的 ， 这 就 意味 着 先是 行 0 的 所 有 元 素 ， 后 面 是 行 ] 的 所 有 元 素 ， 恢 此 类 
Ж. 
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TX 地 址 
омга | [2] 
A[2] 14) 
al | [2] 

JK Pr F ЛИЕВ ЖАПЕК Ps НҢ ЕҢ. 将 A 看 成 一 个 四 元 素数 组 ， 每 个 元 素 又 是 一 个 三 个 int 
的 数组 ， 我 们 先 有 АО] ERETO БЛ АП, ЖЕДЕ. 

到 态 问 和 多维 数组 中 的 元 素 ， 编 译 器 产生 的 代码 要 计算 待 访问 元 素 的 偏 穆 ， 然 后 髓 用 mol 指令 ， 
АЯ PTS ASTE SEHE, БЕ Cnr Bem EEUU ERR TO 作为 索引 。 通 常 ， 对 一 个 声明 如 下 的 数 
1. 

7 D[RIIC]; 

TUUS Dij e (T 8628 BRE x, L(C i 0 IX EL ЕНТ ХЕ НЕ ЕТІН A js. 

ЖЕН rd. Е Ах З ЕО. БИЕЯЯ Феах fi х,, Фейх 保存 
Жі, Mex 保存 着 ]。 然 后 ， 下 面 的 代码 将 拷贝 数组 元 素 А(ШИЯ Т bea: 

À іп Феах, і in Фейх, j in Фесх 






















i ва11 52, %есх j*4 

2 leal {%ейх,%ейх,2),%едх 1*3 

1 leal {fecx, becx, 4), $edx j*41* 12 

d movi ($eax,$edx],$eax Read M[x, + 4(3 - i + f 
ЗІ 3.19 

考 虚 下面 的 源 代码 ， 此 处 ，M 和 和 是 用 #Hdefine 声明 的 常数 ; 
Hdef ine: 

1 int ша&1[М][М]; 

2 int matZ[N] (Mj; 

2 

4 int sum elementíint i, int 1) 

5 { 

6 return matl[i][j1 + zat2[jl [i]: 

7 ) 

在 编译 这 个 程序 时 ，GCC 会 产生 下 面 这 样 的 汇编 代码 ; 

1 movl &í&ebp),X*ecx 


程序 的 机 器 级 表示 157 


movl lZit&ebpj,S$eax 

leal 0{,%еах,4),%еБрх 

leal б{,%есх,8),%ебх 

subl есх, Фейх 

addl ерх, %еах 

gall 52, %еах 

movi mat? (%еах, ecx, 4}, сах 
addl matl { ерх, $edx, 4), %eax 


ЖҚА ie 6 HERB. ARILAR RERA E M fe N HE, 


3.85 国定 大 小 的 数组 

对 国定 大 小 的 多 维 数组 进行 操作 的 代码 ，C 编译 器 能 够 进行 多 种 优化 。 例 如 ， 假 设 我 们 将 数据 
类 型 fix matrix 声明 为 16 x 16 的 整数 数组 ， 

1 #define N 16 

了 typedef int fix matrix[N][N]: 

图 324 (a) rendir ED A 和 了 的 乘积 的 元 素 1、k。fC 编译 器 产生 的 代码 类 似 于 图 3,24 
(b) 中 所 示 的 那样 ， 这 段 代码 包含 很 多 聪明 的 优化 ， 纺 译 器 认 出 循环 会 依次 访问 熬 胡 A 的 元 素 
Afill0]，Aiil[D，…， 喜 国 [15]。 这 些 元 素 占 据 的 是 存储 器 中 从 数组 元 素 A[i]I0] 的 地 址 开始 的 相 邻 的 
位 置 。 因 此 ， 程 序 可 以 用 指针 变量 Apr 来 访问 这 些 连 续 的 位 置 。 循 环 会 依次 访问 数组 ВЛЕ 
BIO]IKj，B(DJ[KJ，…，B[15][k]。 这 些 元 素 占 据 的 是 存储 器 中 从 数组 元 素 B[O][K] 的 地 址 开始 的 位 置 ， 
ТИН 64 个 他 节 。 因 此 ， 程 序 可 以 用 指针 变量 Bpr 来 访问 这 些 连续 的 位 置 。 存世 中 ， 这 个 指针 
会 增加 16， 尽 管 实际 上 真实 的 指针 会 增加 4 .16= 好 。 最 后 ， 民 码 可 以 用 一 个 简单 的 计数 器 来 记录 


ыш Ua — ch іл ag io Dd 


code/asm/array.c 
l #define H 15 
2 rypedsf int fix_matrix[N] [N]; 
3 
4 /* Compute i,k of fixed matrix product */ 
5 int fix prod ele (fix matrix А, fix matrix B, int i, int К) 
6 { 
7 int j; 
B int result = 0; 
3 
10 for (j = 0; j < N; j++) 
11 result += A[i]ij] * B[jijl IK]; 
12 
13 return result; 
14 } 
code/asm/array.c 
(a) Ifi C 代码 
соағғазтуағғау.с 


/* Compute i,k of fixed matrix product */ 
2 int fix prod ele optí(fix matrix A, fix matrix B, int i, int k) 
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3 

4 int *Аріх = &A[1][0]; 
5 int *Bptr = &В[©][К!; 
б int cnt = N - 1; 

7 int result - 0; 

2 

9 do 1 

10 result += I*Aptr) * i*Bptr): 
11 Aptr += 1; 

12 врт += N; 

12 cnt--; 

14 } while (СП >= 0); 
15 

15 return result: 

l; |) 





— à ——Á—— ———— —. Ӱ 


(b) ikili cum 
图 3.24 ”原始 的 和 优化 过 的 代码 ， 该 代码 计算 固定 长 度数 组 的 矩阵 乘积 的 元 束 i、K 
AERE A FL AERA ER. 
我 们 给 出 了 fix prod ele op BJ C Ri. KHH C SEXE EP ЕЙ ЖЕГЕН SUE. НІНЕ 
JC TRAP ROI SE B RT ИИ: 


Aptr is in %edx, Bptr in 9tecx, result in езі, cn! in ФеВх 





code/asm/array.c 


1 .L23: loop: 

2 mov] (Жедх),%еах Compute t = *Аріғ 

3 imull {%есх),%еах Compute v = *Bptr *t 
4 addl €eax,*esi Add v result 

у add: 554, %есх Add 64 to Bptr 

6 addi $4, $edx Add 4 to Aptr 

] deci ebx Decrement cnt 

8 ins .123 if >=, if >=, ento loop 


注意 ， 仁 上 面 的 汇编 代码 中 ， 所 有 的 指针 增加 量 均 乘 以 伸缩 因子 但 4. 


练习 题 3.20 
下 面 的 己 代 而 将 一 个 固定 大小 的 数组 的 对 第 线 元 素 设置 为 va]; 


/* Set all diagonal elements to va] */ 
void fix sec diaqgiL:x matrix А, int val) 
i 
int 1; 
Гог {1 = 0; i < N; i++) 
А[11{1] = val; 


-] x їл Ым Lu BM) p 
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当 编 译 时 ，QCC 产生 如 下 汇编 代码 ; 


movl 12{%єрр),%ейх 

movl В{%ерр),%еах 

movl $15,8ecx 

addl 51020,*eax 

.p2Zalign 4,,7 Added to optimize cache performance 
.L 5d: 

movl $edx,í$eax] 

addl 5-53, %еах 

decl Жесх 

jns .L50 

创建 一 个 C 伐 码 程序 ， 它 使 用 类 似 于 这 上段 汇编 代码 中 所 使 用 的 优化 ， 风 格 与 图 324 (b) 中 的 

AUS d$ 


3.8.6 aS BORSE 

C 只 文 持 大 小 在 编译 时 就 能 知道 的 多 维 数组 【对 于 第 - - 詹 可 能 有 些 例 外 7)。 在 许多 应 用 种 席 中 ， 
我 们 需要 代码 能 够 对 动态 分 配 的 任意 人 小 的 数组 进行 操作 。 为 此 ， 我 们 必须 显 式 地 写 出 从 多 维 数组 
到 - 维 汐 组 的 瑞 射 ， 我 们 可 以 将 数据 类 型 var matrix 简单 地 定义 为 int *: 

typedef inz *чаг_ matrix; 

我 们 用 Unix ҒА Ж calloc 来 为 “个 nxn 的 整数 数组 分 配 和 初始 化 存储 : 

1 var matrix new var matrixiint п) 

2 { 

3 return ivar matrix) callocisizeoflint], n * n); 

4 ) 

calloc ЕЖ (ANSI C 文档 的 部 分 32，401) 有 两 个 参数 :每 个 数组 元 素 的 天 小 和 所 南 数 组 元 
素 的 数 日 。 它 试 者 为 整个 数组 分 也 空间 。 如 昌 成 功 ， 它 会 将 整个 存储 器 区 域 苦 始 化 为 9, ЛЕНІП 
同 第 -个 字 太 的 指针 。 如 果 没 有 是 够 的 果 用 空间 ， 它 就 返 可 宅 (null), 
给 CSS: C. Сені Java rh SERES ERROR 

& Cb. RATARA EAGAR) ФАО ЖЫ АЖ malloc 或 
саНос. ENHAT C++ 和 Java 中 的 new Ж. C Ж Ca Eka A E Kab B) ке 函 孝 来 释 
жездің, Æ Java 中 ， 释 放 是 由 运行 时 系统 通过 一 个 称 为 garbage collection (RARIK) 的 
进程 自动 完成 的 ， 第 10 童 中 会 讨论 这 本 话题 


Жүн, БИНТИ ЕН КИЯЛ Ы ЕЗБЕ. j AMNA i пәр 


e xD бп — C (л ap d XM ғ 


c 


1 int var eleí(var matrix А, int i, int j, int n] 
2 { 

3 return А[+1*п) + Jj; 

4 ] 


КЕП Ы АННЫ. 
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1 movl 8 (%ерр!, едх Cret А 

2 movl 12 (%ерр) ,Жеах Get i 

3 'mull 23í(%ebp),%eax Compute n*i 

4 add] 16{%ерр},%еах Compute n*i + j 
5 novl i(€edx,£€eax,4!),$e6ax Get Alin + j} 


ЖАҚ ES Fou ЕАН REREH Ala PULS Kh MS Ж. ТЖ 
用 -条 乘法 指令 来 将 IA a Gs m ERI tb INEI, ERRAR T ЗАҢ ЗЕТА ЈЕЛ 
会 市 来 严重 的 性 能 损失 。 

在 许多 情 训 中， 编译 器 可 以 使 用 相同 于 我 们 已 描述 的 国定 大 小 数组 的 优化 原则， 来 管 化 人 小 可 
变数 组 的 下 标 计算 。 例如， 图 3.25 GO ШИ C 代码， 计算 的 是 两 个 大 小 可 安 害 阵 A 和 B ЖӘН 
КізЖі. k. (083.25 cb) 中 ， 我 们 给 出 了 一 个 优化 过 的 版 本 ， 它 荐 根据 编译 原始 版 本 产生 的 汇编 
代码 着 加 生成 的 。 编 译 串 可 以 利用 出 往 环 结构 产生 的 喇 序 访问 和 模式， 消除 邦 数 滋 法 i*n 和 jtn ТЕЛА 
种 情况 中 ， 编 详 器 不 会 产生 指针 安 量 Bptr， 人 而 是 创建 个 我 们 称 为 nmTjPK OX “п EU m EK 
的 整数 变 莉 ， 因 为 相对 于 原始 代码 ， 它 的 值 等 于 n#j+k。 最 开始 时 ，nTjpk 等 于 k, TK EROR NOE 
An n. 


code/asm/array.c 
1 Lypedef in: *var matrix: 
2 
3 /* Compute ik of variable matrix product */ 
4 int var prod ele(var matrix А, var matrix B, int i, irt k, int n] 
5 l 
Б jnt 1: 
7 int result = 0; 
8 
9 for [32 0; J < n; j++) 
10 result += A[i*n + j] * Bfj*n + k]; 
11 
12 return resulL; 
13 1 
code/asm/array.c 
Ca) НЕСІН 
一 code/asm/array.c 
1 /* Compute i,k of variable matrix product */ 
2 int var prod ele optivar matrix А, var matrix В, int i, int K, int п) 
à 1 
4 int *Aptr = &A[i'n]; 
5 int nT]Pk = n; 
Ë int cnt = n; 
j int result = J; 
ü 
q if in <= 0) 
10 return result; 
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11 
12 do { 
13 result += (*Aptr) * В[пТ1РК]; 
14 Aptr += 1; 
15 nTj]Pk += n; 
16 спЁ--; 
17 } while (cnt); 
18 
18 return result; 
20 ) 
сойе/аяту/акғау,с 
(Б) КН C 代码 
Ж 3.25 YARIS КФ НОЕН ЛЖ. 的 原始 和 优化 过 的 代码 
BI dup ds A КД, О. 


编 详 器 为 循环 产生 代码 ， 其 中 寄存 器 %edx 保存 cnt. bebr 保存 Ари. Фесх 保存 n TjPk. 而 Wesi 
保存 结果 。 这 段 代 码 如 下 : 


] „L37: loop: 

2 movl 12(%ФеБр),%оах Ger B 

3 movi (%ebx),%edi Get *Apir 

4 addi $4,%ebx Increment Aptr 

5 imull ;$eax,&ecx,4),&edi Multiply by B[nTjPk] 
6 addl €*edi,$*esi Add to result 

7 addl 24{%ерр), есх Add n to nTjPk 

B deci %edx Decrement cnt 

9 іп? .137 If cnt ! 0, goto loop 


注意 , 每 次 循环 时 , 变量 B 和 n Bb ЛАТТЕ ТУЕШ. 这 是 一 个 寄存 器 洲 出 (register spilling) 
的 例子 。 没 有 足够 的 寄存 器 来 保存 所 有 和 需要 的 郊 时 数据 ， 因 此 编译 器 必须 将 某 些 局 部 变量 放 在 存储 
ieri. ШЫ, ИЕНА B 和 nn， 因为 它们 只 用 读 一 次 一 一 在 宾 环 里 ， 必 们 的 值 不 变 。 
寄存 器 溢出 是 TA32 一 个 很 常见 的 问题 ， 因 为 处 理 器 的 寄存 器 数量 太 少 了 。 


3.9 卉 类 的 数据 结构 


C 提供 了 两 种 将 不 同类 型 的 对 象 结合 到 一 起 来 创建 数据 类 型 的 机 制 : SED strueture )， 用 关键 
F struct 来 声明 ,将 多 个 对 象 集合 到 一 个 单位 中 ， 联 全 (union)， 用 关键 字 union X788], PFE JL 
种 不 同 的 类 型 来 引用 一 个 对 象 。 
3.9.1 结构 


C 的 street 户 明 创建 一 个 数据 类 型 ， 将 可 能 不 同类 型 的 对 象 突 合 到 一 个 对 象 中 。 结 构 的 各 个 组 
成 部 分 是 用 名 字 来 引用 的 。 结 构 的 实现 英 似 于 数组 的 实现 ， 因 为 结构 的 所 有 组 成 部 分 都 存放 在 存储 
路 中 连续 的 区 域内 ， 而 指向 结构 的 指针 就 是 结构 第 一 个 字 节 的 地 址 。 编 谋 器 保存 关于 每 个 结构 类型 
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HEE Erid Слеза) 的 了 分 偏 移 ， 它 以 这 些 偶 移 作 为 存储 器 引用 指令 中 的 伺 移 ， 从 而 产生 
МТЖ. 


给 忆 语言 初学 者 : ARRETA struct 

struct 4i 38 3€ 29 65 29:8 i JE ( constructor ) Æ C 提供 的 与 C++ 和 Java 53] ЁЁ o dut Ю, Ç 
许 程序 员 保存 关于 一 个 数据 结 轴 中 基 些 实体 的 信息 ， 并 用 名 字 来 引用 这 些 信息 ， 

例如 ， 一 个 图 形 程 库 可 能 要 用 结构 来 表示 一 小 长 方形 ， 


struct rect f 


int lix; + X coordinate of lower-left corner */ 
int llv; + Y cootdinste of lower-left corner */ 
int color; Ж Coding of color */ 

int width; жүл А (in pixels) */ 


int height; /* Height (in pixels) */ 
}; 


我 们 可 以 声明 一 个 struct rect ЖЖ aq de r. МСНЕН И T t. 


struct rect r; 
т.11х = r.lly = 0; 
r.colcr = OxFFOUFF; 
r.width = 10; 
r.heighk = 20: 
iX € $ Ë Á rllx 362 2538 ү 65 Ux MK. 
3-48 6) 55 Ж 6 EAT AL — A-4274 UE 913 МА, MEERLE, АКЕЛ. Жо, TE 
УК И ER, АЖ, ABAAA 0%, 386333 struct ЕЛЕҢ: 
int àreaí(struc- rect *rpi 
{ 
return í(*rp).width * [(*rp),.height; 
) 
SA S (*rp).width 8485] A T iX4- 484b, ЖВАКИЯНЯЯ width 域 ， 这 里 必须 要 用 括号 ， 
B ЖЖЖ it kuk A pwdh Ж ЖЕ А *(rpwidth), ik aki, IHE RI B fedi 52 ВЕЧЕ А 
ЕЕ ДЕТСТВЕ МЧА, E? 外 ->width APT K ik K rp)width, 例如 ， 
AJDILOE-—A4GK, CdPOCA KA 84 Ed 905. 
void rotate lertí(struct rect *rp) 
( 


7* Exchange width and height */ 

int t = rp-»height; 
rp--height - rp-»width; 
rp-»width = t; 


} 


С Java Е C 中 的 站 构 要 复杂 精细 得 多 ， 因 为 它们 将 一 组 可 以 被 调用 以 执行 计算 的 方 
法 与 一 个 对 象 联系 起 来 在 C 中 ， 我 们 可 以 简单 地 把 这 些 方法 写成 普通 通 数 ， 就 像 上 面 所 示 的 函数 
area 和 rotate. left. 
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让 我 们 来 看 看 这 样 Pb f, Е ТЕО РЕНИ А BH, 
struct rec 1 
int 1; 
int j; 
int a'i]; 
int *p; 
}; 
这 个 结构 包括 四 个 域 一 一 两 个 4 字 节 int、 一 个 由 二 4 字 节 int 组 成 的 数组 和 -- 个 4 字 季 的 整数 
目 针 一 一 总 共 是 24 ^r 


0) 4 20) 


{яі 8 
"ES 


注意 ， 数 组 a 是 嵌入 到 这 个 结构 中 的 。 | 图 中 顶部 的 数字 给 出 的 是 各 个 域 相对 结构 开始 处 的 字 
т. 

ALT AEST. РЕК ЕРТЕМЕН ЕНЕДІ КЕЗЕНЕ. 例如 , 假设 struct rec * 
头 开 的 变量 T 放 在 寄存 器 %edx D. 然后 ， 下 面 的 代码 将 元 素 т 拷贝 到 元 素 г>]: 

1 movl (Фейх),Жеах Get r-> 

à movl $eax,4[$edx] Store in r-»j 
AAR i HERE О, ЖИА HS B E r BJ. AT fpe RU. CRR r КОБЕН ЕЙ 
移 量 4. 

鉴 产生 一 个 指 回 结构 内 部 对 象 的 指针 ， 我 们 只 需 将 结构 的 地 址 加 上 该 域 的 偏 移 景 。 例 如 ， 我 们 
FUB CES EE В+4. 1= 12， 就 可 以 得 到 指针 太 {( 玉 >a[]])。 对 于 在 害 存 器 %eax 中 的 指针 7 和 在 寄存 
Abed 中 的 输 数 变量 i， 我 们 可 以 用 一 条 指令 产生 指针 及 (7->a[ 起 的 值 ， 

кіп Жеах, i m Фейх 
| leal 3(*eax,€$edx,4),tecx Фесхг &r-»ali] 
还 有 最 后 一 个 价 Т. 下面 的 代码 实现 的 是 语句 ， 


r-»p = &r-»a[r-»1 + Г->11; 


ЖЕН ЛЕЙ ЖЕ edx Б: 

1 movl 4 |%ейх),Феах Get r-»j 

2 асат (%ейх),%еах Add г->і 

3 leal В{%ейх,%едх,4),%еах Compute &r-»[r-»i + r-»j] 
4 movl Ф%еах, 20 (%едх) More in r-»p 


正如 这 些 示 例 表 明 的 那样 ， 对 结构 的 各 个 域 的 选取 完全 是 在 编译 时 处 理 的 。 机 器 代码 不 包含 关 
于 域 声明 或 域名 字 的 信息 。 


练习 题 3.21 
考虑 下 面 的 结构 声明 ， 


struc- prob { 
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int %р; 
struct i 
int X; 
int v; 
} ы; 
struct prob *next; 
1: 
ik Л ARA НАҚ ЖЯ М, АЙКЕ" УЛАК SE & h F 
在 数组 中 一 样 . 
телі (SWT Kb Kik K) 是 对 这 个 站 构 进行 操作 的 : 
void sp inirzíistruct prob *sp! 
{ 
HD-29. X 
Sp-»p 
ap-»next 


ц n H 


} 
А. 下 列 域 的 偏 移 量 是 多 少 { 用 字 节 表示 }? 
р: 
З.Х: 
Sy: 
next: 
B. 该 个 结构 总 共 需 要 多 少 字 节 ? 
С. 编译 器 为 sp int 的 主体 产生 的 汇编 代码 如 下 ， 
movi 8{%ерр),%еах 
movl @{%еах),%ейх 
movl %ейх,4!%едх) 
leal 4(%самх),Жедйх 
movl £€edx, {гах 
movl $еаҳ, 12 (%еах) 


根据 这 些 信息 ， 填 写 出 sp_init 代码 中 缺失 的 表达 起 。 
3.9.2 联合 


CO л = ім b 一 


ТАЖ 


联合 提供 了 一 种 方式 ， 能 够 规 坟 忆 HEURA, MAERAH AS. 联合 声明 的 
庄 法 与 结构 的 庄 法 一 样 ， 只 不 过 语义 相差 比较 六。 它们 不 是 用 不 同 的 域 来 引用 不 同 的 存储 器 块 ， 而 


是 引用 的 同一 存储 器 块 。 
Bü Fm. 
struct 53 1 

char c; 
int 1121: 
double v; 
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}; 


union U3 [| 
Char c: 
int i[2]: 
double v; 
un 


КЕННЕН! 85 ІЛМЕ ААА ТЕРЛЕ: 





(一 会 儿 我 们 会 看 到 为 什么 S3 中 的 懈 移 量 为 4， 而 不 是 1.) 对 于 类 型 union U3* 的 指针 р, 
p >c、P->if0] 和 p-»v 引用 的 都 是 数 撕 结构 的 起 始 位 置 。 还 要 注意 ， 一 个 联合 的 总 的 大 小 等 于 它 量 
大 域 的 大 小 。 
企 一 些 情 况 中 ， 联 合十 分 有 用 。 但 是 ， 它 也 引起 了 一 些 讨 大 的 错误 ， 因 为 它们 线 过 也 类 型 系 
统 提 供 的 安全 措施 。 一 种 包 用 情况 是 ， 我 们 事先 知道 对 一 个 数据 结构 中 的 黄 个 不 同 域 的 使 用 是 互 奈 
的 ， 那 么 将 这 两 个 域 作 为 联合 的 一 部 分 ， 而 不 是 结构 的 一 部 分 ， 会 减 小 分 配 空间 的 总 量 。 
例如 ， 收 设 我 们 想 实 现 一 个 二 叉 树 的 数据 结构 ， 每 个 时 了 节点 都 有 一 个 double 的 数据 值 ， 而 每 
个 内 部 节点 都 有 推 向 贿 个 孩子 节点 的 指针 ， 但 是 没有 数据 。 和 如 果 我 们 像 这 样 声 明 ， 
struct NODE 1 
struct NODE *left; 
struct NODE *right; 
double data; 
Із 
ЖАҢ УТЫН 16 ЕА, ЕҢ ЖИЕН Е-Е. НЫ, 如果 我 们 这 样 来 声明 一 
TOM E 
union NODE { 
struct [ 
union NODE *left; 
union NODE *right; 
} internal: 
double data: 
); 
ЖА, ОДИН 8 Е, ШЖ n 是 一 个 指针 ， 指 向 union NODE * 类 型 的 节点 ， 我 们 用 
n->data 来 引用 叶子 节点 的 数据 ， 而 用 п->мета ей 和 m->intermalright 来 引用 内 部 节点 的 孩子 。 
不 过 ， 如 困 这 样 编 玛 ， 就 没有 办 法 来 确定 一 个 给 定 的 节点 到 底 是 叶子 节点 ， 还 是 内 部 和 节点。 通 
弟 的 方法 是 引入 一 个 附加 的 标志 域 : 


struct NODE { 
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int is leat; 
union 1 
Struc- [f 
struct KODE *left; 
struct KODE *right; 
| internal; 
double data; 
) info; 

}; 

ХАН, Ж Y hpa Ж, Жі leaf 是 1, ПІЛРІНГІН Жіл, ВИНА 0. RANEE RE ЈЕ 
Ер ЖІ: 15 leaf 要 4 个 ， info.intermal.left 和 infointemal.nght 各 要 4 个 或 者 info.data € 8 4, 
TAR а, ЖАҒА А ЖОЙ, ТЕҢ ЕСТЕ. Xp TG: 3 m ЕЕЕ 
ы, XXEFII EE AU s| A — 26, 

ЖЕП) БАШ RU Rp Te Ж LE PE S BL, FERRARE A float 作为 unsigned 
的 位 表示 ; 


1 unsigred floact2bit(fioat Ë) 


2 i 

3 union 1 

4 float f; 

5 unsigned u; 
Б ) temp; 

7 Lemp.f - f; 

B return temp.u; 
әр 


在 这 段 代 码 中 ， 我 们 以 -种 数据 类 型 来 存储 联合 中 的 参数 ， 叉 以 男 一 种 数据 类 型 来 访问 它 。 有 
想 的 是 ， 为 此 过 程 产生 的 代码 与 为 下 向 记 个 过 程 产生 移 代码 是 一 样 的 ; 


1 unsigned copyíunsigned ut 


2 d 

i return u; 

407) 
ХАМ АНА — 1S. 
1 movl 8іЖеБрр),%есах 


XX DUE BIET КТА ЖАҢ ДА. АЛЕКЕ 个 float， 还 是 一 个 unsigned， 它 部 在 相对 于 
%ebp 懈 移 量 为 8 的 地 方 。 过程 只 是 简单 地 将 它 的 参数 找 训 到 返回 值 ， 不 修改 任何 售 。 
当 用 腾 合 来 将 各 种 不 同 大 小 的 数据 类 规 结 合 到 一 起 折 ， 字 节 顺 序 问题 惑 变 得 很 重 槛 了 。 例 如 ， 
假设 我 们 号 了 一 个 过 程 ， 它 会 以 项 个 4 字 节 的 unsigned 的 位 的 形式 ， 创 建 一 个 8 学 节 的 double: 
1 double Dit2double(unsignec wordü, unsigaed wordl) 
{ 
union { 
double d; 
unsigned u[2]; 
} temp; 


Cv ұл dm Du мо 
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=) 
5 


В temp.ua[0! = wordü; 
9 temp., 2111 = wordi; 
18 return temp.d; 


il) 
在 像 LA32 RER 3 HA: (little-endian 9,135 E, ЖИ могао 会 是 d 的 低位 四 个 字 人， 而 wordl 
ARE UU. EXE (big-endian) 机 器 上 ， 这 两 个 参数 的 第 色 刚 好 相 吧 。 


练习 题 3.22 
考虑 下 面 的 联合 声明 ， 
union ele 1 
struct { 
int *р; 
int y; 
] el; 
struct { 
int x: 
union ele *next: 
) e2; 
}; 
iX AM АНЕ УГРА К. 
аз (W T АДА) А-АА УТЕ О, mE Л Жай К. 
void proc iunion ele *up) 
1 


LU 六 -> = *[up-» ) - up-» 


) 


A. 下 列 域 的 篇 移 量 是 多 少 【 用 字 节 表示 ) ? 
el.p: 
el.y: 
ez x: 
e2,next: 
B. 这 个 结构 总 其 需要 多 少 字 节 ? 
CC， 编译 器 为 proc 的 主体 产生 的 汇编 代码 如 下 : 
1 movl 8i*ebp),£€eax 
mov] 4[*eax),tedx 
movl Жейх) ,Зесх 
movl Ферр,Феяр 
movl (Зеах),Феах 
movl (Зесх),Фесх 
subl ®гах,%есх 
movl %есх,#{%ейбух) 


根据 这 些 信 息 , HUS H proc {Р AR K ААА, 提示: 有 些 联 合 引 用 可 以 有 多 种 意思 的 解 样 。 
正如 你 看 到 的 那样 ， 在 进行 引用 的 地 方 ， 能 解决 这 种 歧义 ,只 有 一 种 答案 不 需要 进行 任何 类 型 转换 ， 


а» -] Ch N кым L. [Гы 


108 RIF 


也 不 会 违反 任何 类 型 限制 ， 


310 X7 (alignment) 


ET E ESEBLR ЖАН Д пр ЕНБЕК T EE, R Ah ЖД А ҚАЛЫ, 
MEETA k OARE 45k 8) KER. КНАГА ТАИ РНЕ НАЗЕ 2 [a] E CLIE 
fr. MaL АНЕ ЗА EATA ATEK, Miei A RAER. ШЕВ 
们 能 保证 所 有 的 double 都 将 它们 的 地 址 对 齐 成 8 的 信和 数 , НА р МЕНЕЕ 
ET. 否则 ， 我 们 可 能 需要 执行 两 次 存储 器 访问 ， 因 为 对 象 可 能 分 放 在 两 个 8 字 节 存储 器 块 中 。 

JR Eu Аг. 1А32 硬件 都 能 止 确 工作 ,不 过 ，Imtel V6 E S£ RON ЖАН Ch a Л 
统 的 性 能 ，Linux 沿用 的 对 齐 策略 是 2 ТӨТЕН CUTS short) 的 地 址 几 须 是 2 的 倍数 ， 而 较 大 
的 数据 类 型 (例如 jnt、int *、fleat 和 double) 的 地 址 必须 是 4 的 信 数 。 注 意 ， 这 个 要 求 就 意味 着 一 
个 short 美 地 对 象 的 地 址 的 最 低谷 必须 等 于 0. ЫН, Ej int 迷 型 能 对 象 或 指针 的 地 址 的 最 低 岗 
位 必须 都 是 们 。 

Bk. Microsoft Windows 的 对 齐 

Microsoft Windows 对 对 齐 的 要 求 更 严格 一 一 任何 大 字 节 ( 基本) 对象 的 地 址 都 必须 是 上 的 倍数 
特别 地 ， 它 要 求 一 个 double 的 地址 应 该 是 8 的 局 数 。 这 种 要 来 提 商 了 存储 器 性 能 ， 代 价 是 浪 各 了 一 
些 空间 。Linux 中 的 设计 决策 可 能 对 i386 很 好 ， 以 前 存储 器 十 分 缺 院 ， 而 存储 器 意 线 只 存 生 个 字 节 
Y. ЯТЯЖҚАНВ АЙ, Microsoft 的 对 齐 策 略 许 是 更 好 的 选择 了 。 

命令 行 选项 -malign-double 会 使 Linux 上 的 GCC 为 double 美 型 的 数据 使 用 8 PHAR., 这 会 
提高 存储 器 性 能 ， 但 是 在 与 用 4 字 节 对 痉 方 式 下 编译 的 库 代 码 链 接 时 ， 会 导致 不 兼容 ， 


确保 每 种 数据 类 型 前 是 按照 指定 方式 来 组 织 和 分 配 的 , 即 每 种 类 型 的 对 每 都 满 是 它 氏 对 齐 限 制 ， 
BA nf IR UE SCENE. 编译 器 在 汇编 代码 中 放 入 命令 ， 指 明 全 局 数据 所 党 的 对 齐 。 例 如 ，3.6.6 小 节 中 
跳 转 表 的 汇编 代 但 声明 的 第 2 行 就 包含 下 面 这 样 的 命令 Cdirective): 


.align 4 

RAET CEDAR Ced. ЖӨН ЕНА) 会 从 以 4 为 倍数 的 地 址 处 开始 。 因 为 每 个 
Ж 4 个 守节 ， 后 面 的 元 素 都 会 遵守 4 = We B) M Ы. 

人 外 配 存储 器 的 库 例 程 (例如 malloc) 的 设计 必须 使 得 它们 返回 的 指针 能 满嘴 最 糟糕 情况 的 对 齐 
нен, XU E 4 或 者 8。 对 于 有 结构 的 代码 ， 编 译 器 可 能 需要 在 域 的 分 配 中 插入 问 峡 ， 以 保证 每 个 
结构 气 素 部 满足 它 的 对 齐 要 求 ， 谭 顷 构 本 身 对 它 的 起 始 地 赴 也 有 -- 些 对 齐 要 求 。 

出 如 说 ， 考 虑 下 向 的 结构 声 只 ; 

struct 51 : 

int i; 

char c; 

int j: 
T 
ЖИЕНИ ЖЕЛЕ ТОК, uii Boe Rx EE S: 


程序 的 机 器 级 表示 169 


ің Ü) 4 5 


^* 


к ЛЕП Елі (Da D) Aj iW 50 HAF + ЖКП. ҒЫ, iR TE с 
Nij 之 各 插入 一 个 了 3 字 节 的 间 了 СЕН "XXX" Ж): 
Шс; 0 4 5 8 


"s XXX 


ЖШ, 的 人 帆 称 其 为 8， 而 整个 结构 的 大 小 为 12 字 节 。 此 让 ， 编译 器 必须 保证 任何 struct SI. * 
类 型 的 指针 pp 部 满 是 4 字 节 圣 齐 。 用 我 们 前 面 的 符号 ， 计 指针 рах, ЖА, xy 必须 是 4 的 倍 
Ж. EUR UE Т poi (МЫШ x A p-> 《地 址 各 +4) 都 满足 它们 的 4 字 他 对 章 要 求 。 

另外 ,编译 器 可 能 击 占 添加 一 些 填 充 到 结构 的 末尾 ， 这 样 结构 数组 的 每 个 元 素 都 会 满 是 它 的 对 
齐 要 求 。 和 例如， 看 看 下 面 这 个 结构 声明 ， 

struct S2 1 

int 1; 
int ^7 
char c: 

1; 

如 果 我 们 将 这 个 结构 打包 成 9 个 字 节 ， 只 要 哥 证 结构 的 起 始 地 址 满足 4 YAI Ж. ALS 
FA ER uEgS e rk ij fg EX. m. Ж МЕКЕН: 

struct 52 d[4!; 

НІ 9 ЕЛ, ЖАНЕ I АЕ Т л, ЖЇН ЖЖ]. 这 是 因为 这 些 元 素 的 地 址 分 别 为 ха. 
Ха+9. y a+ I8 AE xj + 27. 

网 详 器 会 为 结构 $1 分 配 12 个 字 节 ， 最 后 3 个 字 节 是 浪费 的 空间 ， 

ЖЕ 0 4 8 9 
内 容 

这 样 一 来 ，d HAE EDU ta х. + 12, x, + 24 ха +26. RE x, RA RUE ВТ 

М FIR S n] АЖА Г. 


练习 题 3.23 

对 下 面 每 个 结构 高明 ,确定 每 个 域 的 偏 移 剖 , 结构 总 的 大 小 以 及 在 LinuxAIA32 下 它 的 对 齐 和 要求 。 
A. struct Pl { int i; char c; int j; char d; 9; 

B, struct P2 { int i; char c; char d; int j; ): 

C. struct P3 | short w[3il; char сіз! !: 

D. struct Pd ( short w[3]; char *c[3] }; 

E, struct P2 { struct Pl a[2]; struct P2 *p }; 


3.11 综合， 理解 指针 
指针 是 C 语言 的 一 个 重要 特色 。 它 们 提供 一 种 统一 方式 ， 能 够 远程 访问 数据 结构 。 对 于 编程 新 
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下 来 说 ， 指 针 益 是 会 带 来 很 多 的 困惑 ， 但 是 基本 的 概念 其 实 非 常 简单 。 图 3:26 中 的 代码 说 明了 许多 
这 样 的 概念 。 


1 struct str {  /*Example Structure */ 


2 іле L; 

3 сһаг v; 

4 1; 

5 

6 union uni { /* Example Union */ 

T int t; 

ü char v; 

9 КОМ; 

10 

11 int g = i5; 

12 

13 void funiint* xp) 

14 í 

15 void i(*f)(int*) = fun; # fisa function pointer */ 
16 

17 {* Allocate structure on stack */ 

18 struct str s = [1,'a'); Æ nitialize structure */ 
19 

20 /* Allocate union from heap */ 

2] union uni *up = [union uni *) mallocísizeof:union uni!l; 
22 

23 /* Locally declared array */ 

24 int *ip[2] = (xp, 569}; 

25 

26 Цр->у = S.v-«1; 

VF 

28 pnrintfi"ip = kp, *ip = Sp, **ip = d\n", 
29 ip, *ip, **1р+\; 

30 printfi"ip«l = $p, ip[1] = %p, *1р[1] = Жалп”, 
31 1р+1, ip[1], *1р[1]); 

32 printfi"&s.v = Яр, s.v = '$c'in", &s.v, з.у); 
i3 printf("'"&up-»v = Яр, up-»v = '&c''n", &up-»v, up-»v); 
34 prinL£i"£ = %р\п", Ё); 

35 if (--(*xp) > 0} 

35 Ë (xD ] ; є Recursive call of fun */ 
37) 

38 

39 int testi) 

40 | 

4] int x = 2; 

42 un (sx); 

43 return x; 

440% 


图 3.25 ЖЖ С 中 指针 使 用 的 代码 
在 CC 中， 指针 可 以 指向 任何 数据 类 型 ， 
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* 每 个 指针 都 有 “个 类 型 。 这 个 类 型 表明 指针 指 问 的 对 象 是 哪 一 类 的 。 在 我 们 的 示例 代码 中 ， 
我 们 看 到 了 FERH -- 些 指针 类 型， 


xp,ip[0],iplli 
anion uni * union uzi up 





HEX ЕП ЕТ. ВАЕН T STER A BART, БШ i ERI МӘН) 
类 型 。 通 常 ， 如 果 对 银 类 型 为 T， 那 么 指针 的 类 型 为 红 。 特 殊 的 void * 关 型 代表 通用 指针 。 
Enik. malloc 函数 返回 一 个 通用 指针 ,然后 心 下 被 强制 类 卉 转换 成 … 个 有 类 型 的 指针 《第 
2147). 

. АЛБЕНА АЕ, АЧА АБ ЭК ааа. КНУ NULL СО» 值 表 示 该 
带 针 没有 指向 任何 地 方 。 待 会 儿 ， 我 们 会 看 看 我 们 的 指针 的 值 。 

. ”指针 是 用 总 运算 符 创建 的 。 这 个 运算 符 可 以 应 用 到 任何 1уаше 类 的 C RERE, Юй) 
出 现在 赋值 语句 堪 边 的 表达 式 ， 这 样 的 例子 包括 变量 以 及 结构 、 联 合 和 数组 的 元 素 。 在 我 们 
的 汞 鲍 代 玛 中 ， 我 们 看 到 这 个 操 帮 符 应 用 到 全 局 变量 g 上 (第 24 行 )， 应 用 到 结构 元 素 s.v 
|. (#3217), 应 用 到 联合 元 素 up->vy 上 《第 33 行 )， 以 及 应 用 到 局 部 变量 x F (3842 47). 

. * 操 作 符 用 丁 指 针 的 间接 引用 。 其 结果 是 一 个 值 ， 筷 的 类 型 与 该 指针 的 类 型 相关 。 我 们 看 
到 间接 引用 应 用 到 ip Жер E С 2917), WAR ip] E CB 3147), 以 及 应 用 到 xp 上 
(第 35 4720. 此外， 表达 式 up->Y (第 33 472. 既 间 接 引 用 了 指针 up НЕЛИ TH у. 

s 数组 与 指针 是 紧密 联系 的 。 可 以 引用 “个 数组 的 名 字 【 但 是 不 能 修改 )， 就 好 像 它 是 一 个 指 
Heat ШОШ Chon, app. 与 指针 运算 和 间接 引用 《例如 ，*#(at3)》 有 一样 的 效 
果 。 我 们 可 以 在 第 29 行 看 到 这 一 点 ， 我 们 打印 出 数组 ip 的 指针 值 ， 并 用 *ip 引用 它 的 第 一 
Ж (元素 0. 

а Тана Ule АҚ. AE T - МЕНЕ КЕНТ Cstoriag) 和 传递 代 权 引用 的 功能 ， 这 些 
TAB eT UR ERRE НИН. EFEC 15 412, 它 被 声明 为 一 个 指向 函数 的 
TR: ZARLA int* 作 为 参数 ， 并 返回 void. НИН ағ ЛЫН fn。 当 在 后 面 我 们 使 
НЕСЯ 3641) IS, 我 们 是 在 进行 递归 调用 ， 

СЕБЕЛЕ: ЖЫНЫН 

函数 指针 声明 的 语法 对 程序 员 新 手 来 说 是 特别 难以 理解 的 ， 对 于 这 样 一 个 声明 : 

усій (*£f)(int*); 

要 从 里 【从 “f ”开始 ) 往外 读 . Bt, ADES ON” AAR, РЛАР. e tr) 
(intw)” 表 明 的 那样 ， 它 是 一 个 指针 ， 措 向 一 个 以 一 个 int "ЖАЖА Ж, ЖЕ, АЛЖ, CA 
一 个 指向 一 个 以 int МЕРАН ЖЕН void eid ger. 

四 两 边 的 括 革 是 必须 的 ， 辐 洲 否 则 声明 

void *£(int*); 

HEES, 


(void *) f(int*); 
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ӘЛ, ТЕНМЕ AASER, ЗЕТ ЛАЙ Р, 它 以 一 个 int MEX SEHR M 
void *, 

Kernighan 和 Ritchie (40, 5.12 #1887 — AA X ik C ERRA EHRE, 

我 们 的 代码 包含 很 多 对 printf B9 RJ, ПЕН 一 些 指针 (用 指令 %p》 和 和 值 。 在 执行 时 ， 产 生 下 


1 ір = ÜxbfffefaB, *ip = Oxbfffefe4d, **1р = 2 ip/ü]-xp *p-2:-2 

2 1р+1 = Oxbfffefac, ip[l] = 0х804955с, *ip[1] = 15 ipfij-&gg-i5 

Jj АУ. = Oxbtffefbd, s.v = 'a' зіп stick frame 

4  &up-»v = O0x804976D, up-»v = 'b' up points to area in heap 

5 £f = 0х80484:4 J points io code for fun 

Ë 1р = Oxbfffef68, *ip = üxbfffefe4A, **ip = 1 ipinnewframe, х= 1 

7]  lp4l = Oxbfffef6c, 1р[1] = 0x804965c, *1р[1] = 15 ipfi] same as before 

8B  &S.v = Üxbfffef?74, s.v = Фа" $n new frame 

3 &up-»v = JX8C49770, up-»v = 'b' up points fo hew агей іп heap 
iü Í = 0х8С4841\4 J polnts io code for fun 


RIES, ТАЯ АТ T PRK— KE M test 中 直接 调用 (第 42 行 )， 而 第 一 次 是 间接 
ОЙЛАН CR 36 行 )， 我 们 可 以 看 出 ， 打 印 出 来 的 指针 值 都 对 庶 于 地 址 。 那 些 从 0xbfffef 开始 的 
指针 指名 栈 中 的 倍 置 ， 和 而 其 他 的 是 全 局 存 悄 的 一 部 分 【0x80496sc )， 或 是 品 执 行 代 码 的 “部 分 
COx80484]4)， 或 者 足 挫 中 的 位 补 (0x8049760 和 0x8049770), 

SAI ip 被 初 好 化 册 次 一 一 每 次 调用 fun 都 初始 化 一 次 。 第 一 次 的 信 LOxbfffef68) 小 于 第 一 次 
的 但 COxbfffefa8), 这 是 因为 栈 基 向 下 增长 的 。 不 过 , 数组 的 内 容 山 次 者 是 一 样 的 。 数组 无 素 0 Cip) 
是 一 个 指 问 test 栈 巾 中 变量 x 的 指针 ， 元 素 | 是 一 个 指向 全 局 变量 g 的 指针 。 

我 们 可 以 大 到 绽 构 8 也 被 初始 化 了 两 次 , 两 次 都 是 在 线 中 , 而 变量 up 指向 的 联合 是 在 堆 中 分 配 

ялт. ЖЩ ГДЕ 个 指向 函数 fun 的 指针 。 在 反 汇编 代码 中 ， 我 们 看 到 如 下 fun 的 初始 化 代码 ; 


1 08048414 zfun»: 

2 6048411: 55 push ebt 

3 &048415. 69 е5 тоу Жезр, ере 
4 8048417: 83 ec lc sub 50хіс,%еѕр 
5 804841а: 57 push зеді 


ТЕН ЖЕТЕН КИЕ 0х8048414 就 是 fun 的 代码 中 第 - :条 指令 的 地 址 。 


给 C 语言 志学 者 ， 疝 函数 传递 参数 

其 他 语言 СӨЗ Pascal) 提供 丙种 方式 来 向 过 程 传 递 姑 孝 一 hik (by value) 和 引用 【by 
reference )， 忧 值 是 指 调 用 者 提供 实际 的 泰 数值 ， 丁 引用 是 指 调 用 者 提供 一 个 指向 该 值 的 指针 ， 在 民 
中 ， 所 有 的 泰 数 都 是 传 慎 的 ， 但 是 我 们 可 以 通过 显 式 地 产生 一 个 指向 一 个 值 的 指 畦 ， 并 把 该 指针 传 
RALE, AREMT MERHAR. AA Роп (вх) (图 3.26) PM tk xp 就 是 这 样 的 、 第 一 
次 调用 fun (ах) СФ 4217), 给 了 函 教 一 个 对 test ER EE x 659170. ЖЛ] fun 时 ， 这 个 
守重 都 会 路 小 ， 从 而 在 两 次 调用 之 后 ， 递 归 会 停止 ， 
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3.12 ”现实 生活 : 使 用 GDB 调试 器 

GNU МА GDB 提供 了 许多 有 用 的 特性 来 立 持 对 机 器 组 程序 的 运行 时 评估 和 分 机 ， 我 们 试 
图 用 本 书 中 的 示例 和 统 习 ， 通 过 阅读 代码 ， 玉 推断 出 程序 的 行为 . 有 了 ООВ. ЖАЖА rus iyi 
积 序 ， 同 时 叉 对 程序 的 执行 有 榭 当 的 控制 ， 这 就 刷 得 研究 程序 的 行为 灾 为 可 能 ， 

图 3.27 给 出 了 MEGDB 命令 的 例子 ,在 使用 机 器 级 IA32 程 序 时 ,会 上 有 所 帮 有 同 , 先 运行 QOBJDUMP 
来 获得 程序 的 反 汇 编 版 本 ， 是 很 有 好 处 的 。 我 们 的 示例 都 是 基于 对 交 件 prog 运行 GDB 的 ， 程 序 的 
TER SCALES ПО 页 。 我 们 月 下面 的 命令 行 来 启动 GDB: 

unix» gdb prog 

通 芝 的 方法 是 在 性 序 中 感 兴趣 的 地 方 附近 设置 断 点 ， 断 点 可 以 设置 在 函数 入 喇 后 而 ， 或 是 设置 
在 一 个 程序 的 地 址 处 。 在 程序 执行 过 程 中 , 过 到 一 个 断 点 时 ,程序 会 停 下 来 ， 并 将 控制 运 问 给 用 让 。 
和 企 断 点 处 ， 我 们 能 够 以 各 种 方式 可 看 各 个 寄存 器 和 存 储 器 位 置 。 我 们 也 可 以 单 步 跟 踪 程 序 ， 一 次 只 
质 行 几 条 指令 ， 或 是 前 进 到 下 一 个 断 点 ， 


命令 效果 
开始 和 停止 
quit Exit GDB 
run Run your program (give command line arguments here) 
kill Stop your program 
Жы 
break sum Set breakpoint at entry to function sum 
break *0х80482с3 Set breakpoint at address 0x80483c3 
delete 1 Delete breakpoint 1 
delete Delete all breakpoints 
执行 
stepi Execute oné instruction 
stepi 4 Execute four instructions 
nexti Like stepi, but proceed through function calls 
continue Resume execution 
finish Run until current function returns 
检查 代码 
disag Disassemble current function 
disas sum Disassemble function sum 
disas 0х80483Б7 Disassemble function around address OxB0483b7 
disas Ux8048:b7 0x80483c7 Disassemble code within speci.ed address range 
print /x Seip Print program counter in hex 
检查 数据 
print Seax Print contents of %еах зп decimal 
print /x Seax Print contents of Жеах in hex 
print /Е $eax Print contents of %ëax in binary 
print Фх100 Print decimal representation of 0x 100 
print /x 555 Print hex representation of 555 


print /x 'Sebp4B8) Print contents of %ebp plus 8 in hex 
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print *(int *) ÜxbfffFB90 Print integer at address Oxbffff890 


print *(int *) (Sebp+8) Print integer at address 9eebp + 8 
x/2w Üxbfifff5890 Examine two (4-byte) words starting at address 
Oxb-ffff890 
x/2üb sum Examine .rst 20 bytes of Function sum 
有 用 的 信息 
info frame Information about current stack frame 
info registers Values of all the registers 
help Get Information about GDB 


Е 3.27 GDE 命令 示例 
xg pF LE] ОГ Juk СОВ ЖЕЛ Ж ДЖАЗДЫ b K. 


正如 我 们 的 示例 表明 的 那 神 ，GDB на pia ӘЛЕН, BEI A (用 GDB 的 
help $32 H1) 能 部 服 这 些 毛 病 。 


3.13 存储 器 的 越界 引用 和 缓冲 区 溢出 


我 和 已 经 看 到 ，C 对 于 数组 引用 不 进行 任何 过 界 检查 ， 而 甘 司 部 变量 和 状态 信息 “例如 寄存 器 
值 和 迟 回 指针 》 部 和 存放 在 栈 中 。 这 册 种 情况 结合 到 一 起 就 能 导致 严重 的 程序 错误 ， “个 对 越界 的 数 
组 元 素 的 写 操作 破坏 了 存储 在 栈 中 的 状态 信息 。 然 后 ， 当 程序 使 用 这 个 被 破坏 的 状态 ， 试 图 重新 加 
BA AERA ret 指令 时 ， 就 会 出 更 很 严重 的 错误 。 

一 种 竺 别 弟 见 的 状态 破坏 称 为 缓冲 区 洲 出 buffer overflowo. Ж}. (ЕҢ T Bk 
保存 一 个 字符 串 , 但 是 字符 串 的 长 度 超出 了 为 数组 分 配 的 空间 , 下 区 这 个 程序 示例 就 说 明了 这 个 问题 ; 


/* Implementation of library function gets() */ 


2 char *gets(char *&] 

3 { 

4 int C; 

5 char *dest - &; 

6 while (ic = getchar()) !- 'in' && c !- БОК) 
7 *dest++ = с; 

8 *dest++ = '\0'; /* Terminate String */ 
9 if [c == ЕСЕ) 

1ü return NULL; 

11 return 5; 

13 |} 

13 


14 #* Read input line and write it back */ 
15 void echol) 


16 f 
17 char buf[4]; /* Way too small! */ 
1H get sauf); 


19 рицЕв[эиї);: 
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ВЕНН МЕВА gets 的 实现 ， 用 来 说 明 这 个 函数 的 严重 问题 。 它 从 标准 输入 咸 入 
一 行 ， 夺 通 到 一 个 “\n” 字 符 或 某 个 错误 情况 时 停止 。 它 将 这 个 字符 串 找 贝 到 参数 s 指明 的 位 置 ， 
HER RES ES FELD E null У. ERN echot, RIER T gets， 这 个 函数 只 是 简单 地 从 标准 输入 
中 诗 入 ， 再 馈送 到 标准 输出 

gets 的 问题 是 它 没 有 办 法 确定 是 否 为 保存 整个 字符 串 分 配 了 足够 的 空间 ,在 我 们 的 eho 不 例 中 ， 
我 们 故意 将 比 溃 区 设 得 非常 小 一 一 只 有 四 字 节 长 ,任何 长 度 超过 3 个 字符 的 字符 串 部 会 导致 写 越界 。 

研究 echo 汇编 代码 的 这 一 部 分 ， 看 看 栈 是 如 何 组 织 的 ; 





| echo: 

2 pushl &ebp Save ebp on stack 

3 movl евр, %ерр 

4 supl $29, %евр Ailocate space өп stack 

5 pushl €ebx Save $ebx 

Я addi 5-12, %еѕр Ailocaie more space on stack 
7 leal -4($ebp),tebx Compute buf as ФеБр-4 

8 pushl Seb Push buf on stack 

9 call gets Call gets 


全 这 个 例子 中 ,我们 可 以 看 到， 程序 总 失 为 局 部 存储 (storage) 分 配 了 32 个 字 节 (第 4 行 和 第 
6 行 ), 1, 字符 数组 buf 的 位 置 在 Webp 下 方 四 个 字 节 处 (第 7 行 ), 图 3.28 给 出 了 得 到 的 醒 结 构 ， 
止 如 看 到 的 那样 ， 所 有 对 bufl41~buff71 的 写 都 会 导致 多 ebp 的 保存 值 被 破 雨 。 当 程序 随后 试图 以 尼 
为 栈 指针 进行 恢复 时 ， 所 有 后 来 的 栈 引 用 都 会 是 非法 的 ，。 所 有 对 buf[S]— buf[11]i] 5:38 2: S BOR [а 
地 址 被 破坏 ， 当 在 函数 结尾 执行 tet 指令 时 ， 程 序 会 “返回 ”到 错误 的 地 址 。 像 这 个 示例 说 明 的 那 
样 ， 缓 冲 公 溢出 可 能 导致 穆 序 出 现 严重 的 错误 ， 


调用 者 
E Heo 






— 
memo 


echo 


iti 


图 3.28 echo ан 
字符 数组 buf 就 在 保存 的 状 大 下 面 ， 对 buf 的 写 越 界 会 做 坏 程 序 的 状态 ， 


БӨЛІМ echo 代码 很 简单 ,但 是 有 点 太 随 意 了 。 更 好 一 点 的 版 本 是 使 用 fgets 函数 ， 它 包括 一 个 
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一 个 参数 ， 限制 待 读 入 的 最 大 字 节 数 。 家庭 作业 3.37 EKRE Н КИНЕ ЕКИ А ЕНЕ ES 
echo В, 2876. (ӨҢІ pets КНЕ pa r a p s, SLE A SDD. Е-Е 
图 用 pets 的 文件 时 ，C 编译 器 其 至 会 产生 这 样 的 出 错 信 息 :“ 由 e gets function is dangerous and should 
not be used (gets Ж 1676, АЛИН.” 


code/asm/bufovy.c 
1 /* This 1's very low quality code. 
2 It is intended to illustrate bad programming practices. 
3 See Practice Problem 3.24. */ 
4 char *getiine(! 
5 1 
6 char buf[8]; 
7 char *result; 
8 getsibuf); 
9 result = mallocistrlenibut)); 
10 Strepy(result, buf); 
11 returníresult): 
J2 ] 
code/asm/bufovf.c 
Ci 
1 18048524 zqgetline»: 
2 8048524: 55 push %ерр 
3 8048525: 89 е5 mov $esp,*ebp 
4 8049527: 81 ec 10 sub 50х10,%евр 
5 8048522: 56 push &esi 
6 804852b: 53 push %ebx 
Diagram stack at this point 
? 804852c: 83 c4 ҒА add SÜxfFffffff4,tesp 
8 8048521: 8d 5d ЕВ lea ÜxtftffftfffBitebp),t*ebx 
9 8048532: 53 push Жебх 
10 s) 8533: ей 74 Те ff fI call 80483ac < ілік -йх50>» gets 
Modify diagram to show values at this point 
对 gets HA KIROL SN 
3.22 练习 题 3.24 B C 和 反 汇 编 代 码 
练习 题 3.24 


图 3.29 给 出 了 一 个 函数 的 【不 相好 的 ) 实现 ， 这 个 函数 从 标准 输入 读 入 一 行 ， 将 字符 事 措 贝 各 
新 分 配 的 存 能 ， 并 返回 一 个 指向 结果 的 指针 ， 

考虑 下 面 这 样 的 场景 ;过程 getline 被 洞 用 ,返回 地 址 等 于 0х8048642,% 8-2 ebp 等 于 Dxbfifíc94, 
%48-8Феі 等 于 0x1]， 而 寄存 器 %ebx 等 于 0x2。 输 入 字符 素 为 “D012345678901”， 程 序 会 因为 段 错误 
( segmentation ашт) z; 1. 运行 GDB， 确 定 出 错误 是 在 执行 getline 的 rec 指令 时 发 生 的 ， 

A. 填写 下 图 , 说 出 尽 本 能 多 的 甘于 在 执行 完 反 汇 编 代码 中 第 6 行 指 今后 栈 的 信息 . 在 右边 标注 
BARER PHRF (Зо, AEE”) 在 方 框 中 写 出 它们 的 十 去 进 制 值 。 每 个 方 呀 部 代 
支 4 个 字 节 。 另 外 ， 还 需 指出 名 ebp 的 位 置 ， 
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B. 修改 你 的 图 ， 以 展现 调用 ре tX ( 35 1047). 

С. 程序 应 该 试图 返回 到 什么 地 址 ? 

D. Б getline 返回 时 ， 哪 个 【 些 ) 寄存 器 被 破坏 了 ? 

E. 人 徐 了 可 能 会 缓冲 区 溢出 以 外 ，getine 的 代码 还 有 哪 两 个 错误 ? 


缓冲 区 溢出 的 -个 更 加 致命 的 使 用 就 是 让 程序 执行 它 本 来 不 愿意 执行 的 函数 。 这 是 一 种 最 常见 
的 通过 计算 机 网 络 攻 击 系统 安全 的 方法 。 通 常 ， 输 入 给 程序 一 个 字符 串 ， 这 个 字符 囊 包 会 一 些 可 执 
行 代码 的 字 节 编码 ， 称 为 exploit code， 另 外 ， 还 有 一 些 字 节 会 用 一 个 指向 缓冲 区 中 那些 可 执行 代码 
的 指针 划 彰 掉 返回 指针 。 所 以 ， 执 行 ret 指令 的 效果 就 是 跳 转 到 exploit code. 

三 -- 种 攻击 形式 中 ，exploit code 会 使 用 系统 调用 启动 一 个 shell 程序 ， 提 供给 下 证 者 一 组 课 作 
系统 的 图 数 。 在 另 -- 种 攻击 形式 中 ，exploiteode 执行 一 些 末 授权 的 任务 ,收复 对 楼 的 破坏 ,然后 第 
二 次 执行 ret 指令 ，( 看 上 去 好 像 } 正常 返回 给 调用 者 。 

让 我 们 来 看 -个 例子 , 著名 的 Intemet 蠕虫 病毒 在 1988 年 tl 月 通过 Intemet 以 四 种 不 同 的 方法 莫 
取 对 许多 计算 机 的 访问 。 一 种 是 对 finger 守护 进程 fingerd ЈО Н, fingerd 是 通过 FINGER 
命令 来 服务 请 求 的 。 通 过 以 一 个 适当 的 字符 串 亩 用 FINGER， 蠕 虫 可 以 使 远程 的 守护 进程 缓 圳 区 溢出 
并 执行 一 段 代码 ， 该 代码 能 让 蠕虫 访问 远程 系统 。 一 旦 蠕虫 获得 了 对 系统 的 访问 ， 它 就 能 自我 复制 ， 
几 平 完全 地 消耗 掉 机 器 上 所 有 的 计算 资源 。 因 此 ， 在 安全 专家 抓 什 如 和 何 消除 这 种 蠕虫 的 方法 之 前 ， 成 
百 上 干 的 机 器 实际 十 都 竣 奖 了。 这 种 蠕虫 的 始作俑者 最 后 被 抓 住 并 被 起 讨 。 他 被 判处 三 年 徒刑 【缓期 
执行 )、400 个 小 时 的 社区 服务 以 及 10500 美元 的 罚款 。 不 过 ， 即 使 到 今天 ， 人 科 还 是 在 不 断 地 发 现 使 
他 们 容易 遭受 缓冲 区 浇 出 攻击 的 系统 安全 漏洞 ， 这 更 加 究 显 了 小 心 仔细 编写 程序 的 必要 性 ,任何 到 外 
ШАН ЕП АЛ Ж “ОЗА”, ЗАҢ, ЯН agent 的 行为 才 不 会 导致 系统 出 现 错误 。 


Zu. маты ` 

н ҮШҮҮ ana” Г К ГГ Mx 
(worm) ERA- RER, ECT ёз}, АВОИ h S Жети. 5 
RR, AE (viris) ЖЕК, ЕНИЯСАМН ЕКЕ А АШ. 48 
它 不 能 独立 运行 。 在 一 些 大 众 媒体 中 ， 术 潘 “ 病 毒 ”用 来 指 各 种 不 同 的 在 系 访 阅 圣 播 潜 寺 代码 而 繁 ， 
略 ， 所 以 你 可 能 会 听 副 人们 把 本 来 应 该 叫 镍 “ 妇 虫 ”的 未 西 称 浪 了 AK. 


ERREZE 3.38 中 ， 你 可 以 获得 准备 缓冲 区 滋 出 攻击 的 第 -- 手 经 验 。 注意， 我 们 不 能 原谅 任何 
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用 这 种 或 其 他 什 何方 法 来 获得 对 系统 的 未 被 授权 的 访问 。 未 经 许可 闻 入 计算 机 系统 与 奖 入 шт 
是 一 尾 的 一 一 是 一 和 犯罪 行为 ， 即 使 犯罪 者 并 没有 敬意 。 我 们 纵 出 这 样 一 个 作业 有 两 个 时 因 : Ë ë, 
忆 昌 求 对 机 器 语 二 编程 有 很 深 的 了 解 ， 将 许多 问题 结合 了 起来， 例如 栈 的 组 织 、 笠 用 排序 以 及 指 仿 
编码 。 其 次 ， 通 过 讲解 缓冲 区 滥 出 攻击 是 如 何 进 行 的 ， 我 们 希望 你 能 了 解 到 编号 不 多 许 这 种 攻击 的 


Sut. sb TURA S Microsoft 作战 

# 1999 4& 7 А, Microsoft 提出 了 一 种 即时 消息 (TM ) 系统 ,其 客户 端 与 流行 的 美国 在 线 (ACOL ) 
的 IM 服务 器 兼容 ， 这 就 使 得 Microsoft t IMA P sJ ida AOL ІМ АРА, Ж, ЛАБ, 
Microsoft 的 IM J) P E Rik ie 5 AOL 的 IM JH P EX T . Microsoft AA TENGER, 06 
复 了 对 AOLIM 系统 的 服务 , Тел, ЖЖЖ РАЖ s T$ т Т. Rot Microsoft IUE £ 
ЖАҚ БФ AOL IM 的 协议 , ЖДД, AOL 就 是 能 够 确定 一 个 用 户 是 否 运 行 的 是 AOL 
版 本 的 IM 客户 端 ， 

AOL ÈP KREE RERA ЕЖ А RTEA AOL 代码 申 一 个 因 杖 息 所 致 的 “特色 ”， 
AOL 草 用 它 自己 代码 中 的 这 小 错误 ,， 通 过 在 用 户 生 陆 对 攻击 客户 端 ， 采 发 现 假 土 者 . AOL 的 exploit 
code 从 客户 端的 存储 器 映像 中 取出 报 少 量 的 位 置 样本 ， 将 它们 打 成 一 个 网 结 包 ， 发 送 回 服务 器 ， 如 
标 服 务 器 没有 牙 到 这 样 的 包 ， 或 者 知 桂 收 到 的 包 与 预期 的 АО, ЖР Е” ЖИ, ЖАЛ 
ЖАЧА EAE PRSE AOL ARP ib. PIENSO MR PAL Ял, eX ТМ 客户 端 ， 例 各 
Microsoft Kj P Ж. ЖУР] AOL 的 FM & 35. ANTARA AOL EP 39 P di n op E 35 g: 
ЖЕ, m B: M Ed EET. ЖЖЖ EAR RARA RE, (8%. magie 
ВИТ, ЖАПЫ P ÁX3OGdMHSRPET. AOL 只 需 简单 地 收 改 它 的 exploit code, 取出 
ЖРЕБА РАВЕНА. KS, #Ж—Ю{ AOLIEP АЖЕ. ЖГ АНА! 

ЖАИ ЖСга. УРРА AOL ЯЛ BENE SR PAS А. ЖЖА 
ЕЖ. 59 Phil Bucking 893 338 Fl, 34 £$ hb ki K Richard Smith X T РӘ, JE 
TAREA. Smith ЖЕТ -ЖАН, X HEX M MUH Е АА Microsoft P3 ЖЖ БЕ, & Ж. Microsoft 
AAA ОЛА R£ TESI ЯЛАЫНЫЯ--2. AOL 证 不 承认 有 这 样 一 小 错 误 ， 忆 
不 承认 地 们 利用 这 个 错误 ， 序 使 是 在 澳大利亚 的 Geoff Chapell 将 结论 性 的 证 所 公之于众 之 后 . 

ЖА. ЕЛЕН, ИЗАТТЫН КЛ, АО 没有 义务 向 非 AOL 客户 站 开发 
САІМ 系统 ， 所 以 他 们 阻止 Microsoft 是 正当 的 。 吨 一 方面 ， 使 用 蚁 冲 区 溢出 是 件 很 条 了 手 的 事情 ， 
一 个 很 小 的 错误 可 能 就 会 导 效 窗户 端 计算 轨 . 出 浓 ， 酚 且 官司 得 系统 更 客 勇 遭受 外 部 主体 的 攻击 【 员 
МЕЖЕ ТСЖ Н T uU $M) Microsoft 将 AOL doe BOR ov PLE oe zT XE. 
Жі, А Phil Bucking НИАЕТ. KWA AN LA. TENAR АМАЛ 
АЖ, AEREI. i 


3.14 “RS INE 


AC EET ИНВЕ Ф IA32 体系 结构 最 不 优美 的 特性 之 一 。 在 最 早 的 Intl 机 器 中 ， 浮 点 是 由 
一 个 独立 的 协 处 理 器 来 完成 的 ， 这 个 部 件 有 它 自己 的 害 存 器 和 处 理 能 力 ， 能 够 执行 一 部 分 指令 。 这 
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个 协 处 理 器 是 由 名 为 8087 80287 811387 БЕН TGA ЕНІН, ПЕЕ Е Hr 8086. 80286 和 
i386。 在 这 些 产 品 的 开发 过 程 中 ， 蕊 片 的 容量 已 经 不 是 以 在 一 块 芯片 上 既 包 括 证 处 理 器 疼 包 括 浮 点 
协 处 理 器 的 。 另 外 ， 廉 和 价 的 机 器 会 省 去 浮 点 硬件 ， 具 用 软件 来 完成 浮 点 操作 (非常 惕 1)。 从 1486 JF 
48, РН МЕЛ ТАЗ2 CPU 芯片 的 一 部 分 了 。 

1980 Æ. 最 早 的 8087 th Rp ДЕШ RA ТІНЕН. EEA- AL rR pa B ú (ЕРИ), 
同时 也 十 IEEE 学 点 的 第 一 个 实现 。 作 为 协 处 理 器 运行 时 ， 在 主 处 理 器 取出 浮 点 指令 后 ，FPU dE 
过 它们 完成 执行 。FPU 和 证 处 理 器 之 间 有 最 少 限度 的 连接 。 将 数据 从 一 个 处 理 器 传递 到 男 一 个 ， 珊 
要 发 送 方 处 型 器 写 存 情 器 ， 接 收 户 处 理 器 再 从 存储 器 中 读 取 。 直 到 今 大 1IA32 浮 点 指令 集中 还 保留 
有 这 些 设计 的 吉 迹 。 曙 外 ，1980 年 的 编译 技术 比 今天 的 简 卫 得 过。 对于 优化 编译 器 来 说，IA32 % 
点 的 许多 特性 都 是 很 准 的 日 标 。 


3.14.1 浮 点 寄存 器 

学 点 单元 包 所 8 个 浮 点 寄存 器 ,但 是 和 普通 寄存 器 不 -- 样 ， 这 些 寄存 器 是 被 当成 一 个 涛 材 
(shallow stack) 36] f [f] Xe ar d 38 КТА ОБО). 501), FF, НЖЇФы(7). ЕТ, 9500) 
IER. SKARPERE S Tr RUEDAS I AH ALL 

大 多 数 算 术 指 令 不 会 十 接 引 用 寄存 器 ， 出 是 从 栈 中 弹出 它们 的 源 操作 数 ， 计 算 结果 ， 肯 将 结果 
ЖАВ. (20 世纪 70 年代， 栈 结 构 还 被 认为 是 很 聪明 的 想法 ， 因 为 它们 提供 了 一 种 简单 的 赣 尊 
术 指 令 求 值 的 机 制 ， 同 时 它们 也 多 许 指令 的 窗 集 编码 (dense coding)。 随 着 编译 技术 的 进步 ， 癌 时 ， 
KARAER TARE REREH KERERE S. GARRA SE 0 
有 一 组 更 大 的 、 使 用 方便 的 浮 点 寄存 器 ， 


Bit: КЕТЕ 
ТАМА ЕЛЕБЕЯ Т ЖЕ ELE ROS ATA RA qos. KATH 
的 未 值 程序 的 示例 包括 Java TOP UR. Java MEER PSP 813538. 以 及 PostScript 页 面 格 式 化 语言 。 


将 评点 寄存 器 组 织 成 一 个 有 界 的 栈 ， 使 得 编译 器 很 准 用 这 些 寄 存 器 来 存放 一 个 调用 其 他 过 程 的 过 
程 的 局部 变量 。 对 于 局 部 变量 的 存放 ， 我 们 已 经 看 到 ,有些 通用 寄存 器 可 以 被 指定 为 巾 被 调用 者 保 在 ， 
因此 ， 品 以 用 来 保存 暑 过 程 调 用 的 局 部 变量 。 这 种 指定 对 [A32 浮 点 寄存 器 来 说 是 不 可 能 的 ， 因 为 它 
的 标 诺 随 看 信 讨 入 栈 中 和 从 栈 中 婵 出 是 变化 的 。 一 个 庄 栈 操作 会 使 %st(0) 中 的 但 现在 在 名 st(]) 中 ， 

胃 一 方面 ， 它 会 将 浮 点 寄存 器 作为 真正 的 栈 来 对 待 ， 每 次 过 程 调用 时 ， 都 将 本 地 值 压 入 其 中 ，。 
不 二 的 是 ， 很 决 就 会 导致 栈 游 出 ， 因 为 只 有 够 放 % 个 值 的 位 置 。 作 为 代替 ， 编 详 器 产生 的 民雄 会 在 
调用 另 一 个 过 程 前 ， 将 每 个 本 地 泽 点 值 都 压 入 到 主 种 序 栈 中 ， 然 后 在 返回 时 把 它们 取出 来 。 这 样 
引 包 的 存 赃 器 访问 操作 会 降低 程序 的 性 能 ， 

f& 24.6 节 中 说 明 的 那样 ，LA32 浮 点 寄存 器 的 宽 都 是 80 位 。 它 们 以 家 庭 作 业 2.58 中 描述 的 扩 
乞 精 度 格 式 来 对 数字 编 吗 。 当 从 存 情 器 加 载 到 浮 点 寄存 器 了 时， 所 有 的 单 精度 和 双 精 度数 都 转换 成 这 
种 格式 。 运 算 总 是 以 扩展 精度 格式 执行 的 。 当 存 回 存储 器 中 时 ， 数 字 会 从 扩展 精度 转 搞 成 单 精度 或 
双 精 度 格式 ， 


3142 ” 栈 的 表达 式 求 值 
为 了 理解 1A32 是 如 何 用 它 的 浮 点 寄存 器 作为 乒 的 ， 让 我 们 来 看 看 基于 栈 来 求 值 的 一 个 更 加 抽 
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S Б. BOX RIS -IRRE CHRR RAR Rigo ЕШ 3.30 所 加 。 比 如 说 ， 
ӨТІНУ RPN (Reverse Polish Notation. 2 ^^ Жл) 袖珍 计算 器 就 提供 了 这 种 特性 ， 队 了 这 个 栈 ， 
庶 单 元 还 有 一 个 可 以 保存 值 的 存储 器 ， 我 们 用 名 字 来 引用 这 些 值 ,例如 a. bH x, ШЕ 3.30 表明 的 ， 
我 们 能 够 用 load АРАҒА ЖАЛ R. storep НЕНІ ER, OPER ЖАТА ae 
中。 单 操作 数 的 操作 ， 例 如 neg《“ 求 反 )， 将 栈 顶 元 素 作为 它 的 参数 ， 并 用 结果 覆 凋 这 个 元 素 。 冯 操 
作 数 的 操作 ， 例 如 айар 和 multp， 以 栈 项 归 个 元 素 作 为 参数 。 它 们 会 将 两 个 驳 数 都 弹出 ， 然 后 将 结 
果林 问 栈 中 。 我 们 在 存 桩 、 加 法 、 减 法 ， 乘 法 和 除法 指令 后 匠 加 上 后 级 “p"， 是 为 了 强 表 这些 指令 
ЖЫ f e T S EE. 


Load Š # S STARS АҢ 
atorep D е НЕТИ ло FE ria TE D 处 
neg Eg Dn rc ü n 


addp a dig RHE: jk {Т ЖШ 
subp ARH ТЕТ u: lk a pinu 25 
ши Ар ЖЫН ЕЛЖ: ЖЕЛПІНЕ 
атур Ар ЕТ Л: kA ciei 





图 3.30 假设 的 楼 指令 集 
ны Ae Fo ULT A T B e o E. 
TEX S asb), BERAR x-(a-b)/(-bec). МПА ХА ERGAB BERE Fina. TESI 
CINES SEED [Pa Sr YKUN S. CSI EGENTES ЕНЕ — Ж. ПЕНЕН 
下 增长 的 ， 所 以 栈 质 实际 上 是 在 最 底部 。 


(debe "Т то ыса 5 toad a sse (2 


| ! b sutil) 
— | 
load D С Чак 11] а stit] 
b г 第 st [б) 
калаа Tt kertil) 
neg | c 1 #5001) u -h +51 (0) 
| -һ ЫЛ 
a divg | Lhi-h-c | EcELU!) 
1 addp -由 一 + isti: “ 一 i5 i 
5 storep x 
5 load b -b + stil) 
| È | sst [0] 


ЖЖ "P Pl T ЕВЕ, ET THEE GRO HUIUS E НО НИШ. REX 
A ШАЙ URI А, ПЕ КУЛЕШ. 

1. 格式 为 Var 的 变量 引用 。 是 用 指令 load Var 来 实现 的 。 

2. WRA -Expr 的 音 操 作 数 操作 ,这 是 用 先 产 生 Expr 的 代 抬 ,然后 再 跟 一 条 neg 指令 来 实现 的 。 

3. TX А Expr; + Expr, Ехрг)-Ехрғҙ. Expr, * Expr, 或 Expr / Expr 的 双 操 作 数 操作 。 它 的 实 
MEE Expe 的 代码 ， 然 后 是 Ехрг 的 代码 ， 然 后 是 一 条 айар. subp. multp 或 divp 指令 ， 

4. МА Var = Expr 的 赋值 操作 。 这 征 通 过 先 产 生 Expr 的 代码 ， 然 后 跟 一 条 storep Var 指令 来 
KRJ 


作为 一 个 示例 ， 
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看 看 这 样 一 


ІЛМЕ Т x-a-(b/c) 二 此 递归 过 积 会 像 这 样 进行 : 


l. 


产生 Ехрг= a- (р/с) 的 代码 ; 
(а) SE Expt b/c ЧИХ: 


ji, 用 指令 loade 产生 Ехрг = с 的 代码 。 
i. 用 指令 load b 产生 Expr = b 的 代码 。 


ii РЕН? Шур. 


(b) 用 指令 load a 产生 Expr = a 的 代 妈 。 


(с) 广 生 指令 subp. 


2, PEE  storep x. 

整体 效果 就 是 产生 上 下面 这 拌 的 栈 代 但 ， 

1 ied c | c Г st (0) 

2 load b | c | $stí1) 
b Жак Ü) 

з  divn bje &sc (D) 

练习 3.25 

产生 表达 式 x = a*b/c * - 

ХАЖЫ, 


Б 


icad а bic &still 


&stiol 
subp 


Btorep x 


1861 


个 表达 式 x = 4-bic。 因 为 除法 的 优先 级 高 于 减法 ， 这 个 表达 式 加 


(a+b*c) 的 找 代码 。 画 出 每 一 步 代码 的 乒 内 容 ， 记 住 要 遵守 C 的 有 关 优 


当 我 们 想 多 次 使 用 条 些 计 算 结 果 时 ， 栈 求 值 就 变 得 更 加 复 名 了 。 例 如 ， 亏 虑 这 样 的 表达 式 x = 


(asb)*(-(afbj+c)。 为 效率， 


我 们 想 只 计算 a*b 一 次 ， 


但 是 我 们 的 栈 指 令 不 提供 一 种 方式 将 值 你 存 


ЕК, 一 卫 这 个 值 被 用 过 。 因此, 使 用 图 3.30 中 出 出 的 这 样 一 组 指令 , 我 们 会 需要 将 中 间 结 果 a*b 


仓储 在 存储 器 中 某 个 位 置 ， 比 如 说 6 每 次 要 使 用 时 就 取出 这 个 值得 到 下 面 这 样 的 代码 ; 


1 


2 


3 


losd c | C | &st (D) 
load b 11) 
К] set) 
load а | с | 4st (2! 
b %st (1) 
| ü | wat (0) 
multp $st (1) 
аЬ — — | Sat 


load t e йа [1] 
a'b %st (9) 


гаар —... 
оаа t — 
C eb C] аво 
muitp "abita b | %sz(0) 
storep X 777070. 


这 种 方法 的 缺点 就 是 增加 了 额外 的 存储 器 访问 操作 ， 即 使 是 在 寄存 器 栈 有 足够 的 容量 存放 中 间 
结果 时 。JA32 浮 点 单元 避免 了 这 种 低 效 率 ， 引 入 了 算术 指令 的 变种 ， 将 它们 的 第 二 个 操作 数 留 在 栈 
中 ， 叮 以 用 任意 栈 值 作为 它们 的 第 二 个 操作 数 。 另 外 ， 它 还 提供 一 条 指令 ， 可 以 将 栈 顶 元 素 与 任何 
其 他 元 素 进 行 交 换 。 明 然 这 些 扩 展 可 以 用 来 产生 更 有 效 的 代码 ， 但 是 将 算术 表达 式 翻 译 成 栈 代码 的 
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简单 而 优美 的 算法 去 失 了 。 


314.3 浮 点 数据 的 传送 和 转换 操作 

川 记 符 名 gt 来 引用 浮 点 寄存 器 ， 这 时 i 代表 相对 于 栈 硕 的 位 置 。 值 i 的 范围 为 0 一。 寄存 器 
бй) НЕД ЖЖ, Зе RS. WERE. un UL Ses 来 引用 栈 项 元 素 。 当 一 个 新 值 生 入 栈 
ПЕ, 寄存 器 锅 st(7) 中 的 值 就 瑟 失 广 。 当 从 栈 中 弹出 时 ， 免 st() 中 的 新 值 是 不 可 搞 滑 的 。 编 洋 世 产生 
的 代 所 必须 能 在 寄存 回 栈 有 限 的 容量 中 工作 ， 

图 3.31 给 出 的 指令 集 是 用 来 将 值 于 入 浮 点 寄存 嚣 栈 中 的 。 第 一 组 指令 从 存储 器 位 置 中 读 , 这 时 
参数 Addr EEA 268 hhi, ӘЖЕҢ 33 中 列 出 的 某 种 存储 器 操作 数 格 式 给 出 。 这些 指令 是 以 假定 的 
源 操 作 数 的 格 却 米 区 分 的 ， 因 此 人 些 须 从 存储 器 中 读 出 一 组 字 节 。 回 忆 下 符号 MjAddr Xo 
始 地 址 为 Addr 的 b 个 字 节 的 访问 。 人 在 将 操作 数 盯 入 栈 中 立 前 ， 所 有 这 些 指令 都 会 将 它 转换 成 扩展 
精度 格式 。 报 后 的 加载 指令 Па 用 来 复制 - -个 栈 的 值 。 也 就 是 ， 它 将 浮 点 寄存 器 st 人 的 ”个 副本 讨 
入 栈 中 。 例 如 ， 指 令 fld 名 st 人 将 栈 质 元 素 的 аж A rh. 


flcs Ma[Addr] 
fld: Ms.[Addr] 


f1dt Acldr " i MiplAddr] 
fil&l Addr М [Аа] 





图 3.31 Аме 
所 有 的 指令 将 操作 妆 转 并 成 扩展 精度 格式 ， 然 寺 出 入 寄存 器 栈 中 。 


A 3.32 给 出 了 将 栈 项 元 素 存 依 在 存储 器 或 另 一 个 浮 点 寄存 器 中 的 指令 。“ 弹 出 ”有 两 个 版 本 ， 
一 种 是 将 栈 奈 元 素 弹出 栈 (类似 于 我 们 假设 的 栈 求 值 器 中 的 storep 指令 ,一 种 是 非 弹出 版 本 , 将 源 
值 留 在 栈 硕 上 。 同 浮 点 吉 载 指令 一 拌 ， 指 令 的 不 同 变种 产生 的 结果 格式 也 不 同 ， 因 而 会 存储 不 同 数 
H 的 学 节 。 第 一 组 指令 是 将 结果 存 到 存储 器 中 。 地 址 是 用 图 3.3 中 列 出 的 存 信 器 操作 数 格式 中 的 某 
一 种 指定 的 。 第 一 纽 指令 是 将 乒 顶 元 素 拷 贝 到 另外 一 个 浮 扣 寄存 器 中 。 


Ma[Addr] 
MalAddr] 
Milada] 
Maliddr] 
Мдаа) 
fsrpt Ағ Mio Adr] 
fistl Addr Mal Addrl 
fistpl Ат Ma[Adad] 


[st isti) stiil 
fstp isti] 车 号 二 【了 





图 332 БАЯ ИНФ 
BU B8 dc ЖАН ЖИЕНИ ДЕ ДЕНЕН. ПЯ "p^ КЕСЕНИЛЕЙІН. 
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练习 题 3.26 


W Tik kapka TUR. ЖАЙФел 包含 整数 变量 Xx， 而 栈 顶 两 个 元 素 分 别 对 应 于 变量 a 
， 在 方 框 中 写 出 每 条 指令 后 栈 的 内 容 ， 


Cestl Жеах,%еак 


: deur o TM ама, 
а] seo 


4 jmp LS 
5 L11: 
7 L8; 


Bii—# H| x. ade b ҖЕ C Kik, ШЕН НААДА 25, ВЕЛИЖ, 


TB BP nd ТЕЕ ЕЛ ҮРЕ РЫ ЛК A ДЕПУ Й. JR fxch tst (1) 交换 浮 点 寄存 
За ФОН НА. Л ШЕР E: fxch 等 价 于 fxch 9801), ЖЕ, RATRE. 


3.14.4 浮 点 算 木 指令 

图 3.33 说 明了 一 毕 最 常见 的 浮 点 算术 操作 。 第 一 组 中 的 指令 没有 操作 数 。 它们 将 某 些 常数 数字 
МАРЖАН. Жл. е A log210 这 样 的 常数 ， 也 有 类 羽 的 指令 。 第 二 组 中 的 指令 有 “个 操 
作 数 。 这 个 操作 数 总 是 栈 质 的 元 素 ， 类 羽 于 假设 的 栈 求 值 器 中 的 neg 操作 ， 它 们 会 用 计算 出 的 值 取 
代 这 个 元 素 。 第 三 组 中 的 指令 有 两 个 操作 数 。 对 每 个 这 样 的 指令 ， 都 有 关于 如 何 指定 操作 数 的 许多 
不 同 的 变种 ， 符 会 儿 会 谈 到 。 对 不 可 交换 操作 ， 讽 如 减法 和 除法 ， 有 前 四 “向 如 fsub) ЖІК СО 
如 fsubr) ЖАЖА, АТЫ ЯНВ КЫ ЖЕН. 





图 3.33 FARAI 


性 个 点 操作 数 抬 作 部 有 名 个 变种 。 


在 图 3.33 т, ERAS ТД КИНЕ Бир 的 一 种 形式 。 实 际 上 ， 这 个 操作 有 多 个 变种 ， 如 图 
3.34 Вт. ХЕЗ ДЕТЕТО Ж. Ор - Op;， 并 将 结果 存放 到 某 个 浮 点 寄存 器 中 。 除 
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53% 


TAR EEH ЖАН ЕНІН Ж subp 指令 以 外 , IA32 ЖН — ER de M rh ah sk ОТ Фа DE F 
И ТН ПЕ ARERR. ЗЭК, EE AE Е УОН ИА А, Ж H 
IE df fae ИЕН ЖЕЕ. RART LE АЕ. OUS HE SOEUR. Ып. LE W 
TARRAT RERA FRATRER E. HERRITA. Zn UB BEC FPE UR 


Fa BR ТЕҚ ТА ТЕК. 


М 


*sLb& Адат stiil 
*subl Addr %5Е10) 
stubt Addr &sri 


fisubl Addr АЙ) 


tfsub ЖЕЕ i1), %st 
fsub tst (1), БЕ ЦІ! 
tsuhbp &etili,*srii) 


tsubp 


Ma[Addr] sr (Ü) 
Mg Addr] Ет (UJ 
M O [Addr] kst (ü! 
Mi[Addr] st iD} 
grii) +5170) 
+5141) $stíi! 
*st [i) isti! 
$srL [ij kastil] 





图 3.34 浮 扣 减法 指令 


也 有 的 指令 部 将 结 玉 以 扩展 精度 格 涉 存放 针 个 浮 点 寄存 器 中 。 带 后 级 “p” 的 指令 会 漳 出 栈 顶 元 素 ， 


第 二 组 减法 指令 以 栈 顶 元 素 作为 一 个 参数 ， 以 男 外 个 栈 元 素 作 为 另 一 个 参数 ， 但 是 它们 的 参 
数 咽 序 、 结 果 所 使 用 的 日 的 ， 以 及 是 否 会 弹出 栈 顶 元 素 都 是 不 - 样 的 。 注 意 ， 汇 编 代 码 行 fsubp 
Ж fsubp 名 Ss-=，%st 11) 的 简写 。 这 一 行 对 应 二 我们 假设 的 栈 求 值 器 移 subp 指令 。 也 就 是 ， 它 计 
算 栈 质 两 元 素 之 圭 ， 将 结果 存放 在 统 st(1) 中 ， 然 后 弹出 免 st(0)， 这 样 计算 出 的 入 就 在 栈 顶 了 了 ，。 

几 3.33 БИІН ИЯ ХЫ, НЫ 3.34 中 列 出 的 fsub 的 所 有 变种 。 例 如 ， 我 们 可 以 
Н] IA32 指令 写 出 表达 式 х = {a-b)s[-b+e) 的 代码 。 为 了 说 明 方便 ， 我 们 仍然 使 用 存储 器 位 置 的 符号 


台子， 并 假设 这 些 部 是 双 精 度 值 。 


y faddl с E _b +: | &st(Q) 
(fma И 
а T] ааа 

созы b st 
tst (0, 


fmulp (a — 5)(—b + c) %=t (0) 


fstpl x 


ЖЕ КИТ, PERAR x= (a*b)+(-(atb)#c)。 注 意 是 如 何 用 指令 fld st co 在 栈 中 创 
KE a*b 的 两 个 副本 的 ， 这 样 避 免 了 在 临时 存储 器 位 置 中 保存 这 个 值 ， 


ё 


程序 的 机 器 级 表示 


fldl a а | *st (0) 
na estio) ТШТУ Тазы 
аф , *EL Ü) 

fchs | ab | жәе) 
[ —-a-H — аво 

talc Туу teu 
一 人 .由 十 ee &st (0) 


fmulp (-(a-5 г) о р sti] 


练习 其 3.27 
BH TERME- FISHER E. 


5 


7 


£ldl a &stí1j 
Est (ü) 
Ето *stilj,*st &stil) 
&s5t (0) 
Exch %st {ti} 
&5tí(D) 
Idivrl c &st[1) 
%вЕ10) 


fsth x 





用 一 个 忆 表 达 式 来 档 述 这 个 计算 ， 


3.145 在 过 程 中 使 用 浮 点 
同 整数 参数 一样 ， 浮 点 参数 是 通过 栈 传递 给 调用 过 程 的 。 每 个 Поа 类 型 的 参数 需要 4 个 字 节 的 

REM, MEA doube 类 型 的 参数 需要 8 个 字 节 。 对 于 返回 值 为 float 或 double ЖИНА, HR 

是 以 扩展 精度 格式 在 泽 点 客 丰 器 栈 项 部 返回 的 。 
作为 一 个 示例 ， 看 看 下 面 这 个 函数 


1 
2 
i 
4 


HNT %ebp, БЖ а, x. b 和 i 的 位 置 分 别 为 8、16，20 和 28: 


double funct (double а, float x, double b, int 1) 


{ 
returr a*x - b/i: 


) 
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КЕТМЕН ЕЖ, URR ARREU Bm: 
1  fildl 28i&ebp) T 6T sst 


2 fdivrl 204*ebp) | р *є 10) 


з  fids 16 %ebp) &stil) 
вас 


4 fmull 8i[*ebp) ФББ 11) 


b/i 
stb 


% 1E 3.28 


对 于 带 参 数 a、x, b dei (ААҚ 不 同 的 声明 ) 65 838 func. ATE B 2) AARETE 
X AF ag S. 
movl 8í*ebp),*eax 
fidl 12 {%ерр) 
flds 20 (*ebp) 
movl *eax,-4(€tebp) 
#1181 -4(%ebp) 
Ixch *st[2) 
[адар €st,$stil, 
fdivrp €st,$st(.] 
fidl 
flds ?24(€*ebp) 
faddp #81, #80 (11 


i& EHE X 3) double. 5 Æ func t C 4&5, iz X Ж ЫЕ РН S aH КК, 


3.146 ”测试 和 比较 浮 点 值 

关羽 于 整数 的 情况 ， 确 定 两 个 浮 点 数 的 相对 值 包括 用 比较 指令 来 设置 条 件 码 ， 然 后 冉 测 试 这 些 
条 件 码 。 不过， 对 于 浮 点 ， 条 忻 码 是 浮 点 状态 字 的 一 部 分 ， 浮 点 状态 字 是 一 个 16 们 寄存 器 ， 包 含 区 
丁 泽 点 单元 的 各 种 标志 。 几 须 将 这 个 状态 字 转 换 成 整数 字 ， 然 后 测试 某 些 特殊 的 位 。 

如 图 3.35 所 杰 ， 有 很 多 不 同 的 祁 点 比较 指令 。 所 有 这 些 指令 要 行 的 邦 是 操作 数 Op 和 Op, 之 
BE. XU Op 是 栈 项 元 素 。 表 中 每 一 行 说 明了 两 条 不 同 的 比较 指令 ， 一 个 是 有 库 比 较 ， 用 
于 像 < 和 <g 这 样 的 比较 :而 另 一 个 是 无 序 比 较 ， 用 于 相等 的 比较 。 两 种 比较 的 区 别 只 存 于 它们 对 竺 
NaN 值 是 不 同 的 ， 因 为 NaN 入 和 其 他 值 之 闻 没 有 相对 顺序 。 例 如 ， 如 果 变 量 x 是 - :个 Naw， 而 变 
вух, МАЯАДХ<уЛіх-у АЛАР 0. 


ст 


һ 
| 


з XI NaN BI RE аза ЖШ. — 2 
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Econs Addr осот Addr Mal[Addr] 单 精度 
£comL Addr [ucoml Addr мМ] 





Econ їп 1) gt 47] *gt 11] 
feom %st il) 
Ecomas — Addr fucomps — Addr МА] 
tcomp. — Addr fucompl Addr Ma[Addr] 


[ 
1 
fcom» 于 11) fucomp %st (3) +8011) 1 
| 
3 


tocomp fucomp &stil) 
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图 3.35 浮 点 比较 指令 
HIFA XJE Bebe ЕРУ ЖЕТ PUSHES NaN BEREH. 


比较 指令 的 各 种 形式 的 不 同 之 处 还 在 于 操作 数 Ор HERETER, РНР ST 
术 指 令 的 省 圳 形式。 最 后 ， 种 种 形式 的 不 同 之 处 还 在 于 ， 在 比较 完成 后 从 栈 中 漳 出 的 元 素 的 个 数 。 
表 中 所 下 的 第 一 组 指令 根本 不 会 改变 栈 。 即 使 是 对 于 一 个 参数 在 存 情 器 中 的 情况 ， 最 终 这 个 值 也 不 
会 放 在 栈 中 。 第 二 组 中 的 操作 会 将 元 素 Op 弹出 栈 。 而 最 后 一 个 操作 则 会 将 Op 和 Op; 都 弹出 栈 。 

指令 fhstsw 将 浮 扣 状态 宇 传送 到 -个 整数 寄存 器 。 这 条 指令 的 操作 数 是 图 3.2 中 所 本 的 16 位 寄 
站 器 标识 符 中 的 一 个 ， 例 如 免 aX。 状 态 字 中 ， 对 比较 结果 编码 的 位 是 状态 字 的 高 位 字 节 的 0 2816 
Y。 例 如， 如 亲 我 们 用 指令 fnstw Фах 传送 状态 字 ， 闭 么 四 应 的 位 就 在 名 ah 中 。 选 择 这 些 位 的 典型 
МИРЕ Ж НАУ: 

1 fnstew ax More floating point status word іп Фах 

2 алар $69, %аһ Mask ail but bits 0, 2, and 6 

注意 ， 的 no 的 位 表示 为 [00100101]， 也 就 是 ， 三 个 相应 位 上 的 值 均 为 1。 图 3.36 给 出 了 由 这 段 代 
HFR RZ R oah 可 能 的 值 。 注意， 对 于 比较 操作 数 Op 和 Op 只 有 四 种 叮 能 的 结果 : 第 -- 个 
数 人 于 、 小 于、 等 于 第 二 个 数 ， 或 是 两 者 不 能 比较 ， 只 有 当 一 个 值 为 NaN 时 ， 才 会 出 现 最 后 一 种 结 
&. 





H 336 对 浮 点 比较 结果 的 编码 
结果 编码 在 浮 点 状态 字 的 高 位 字 节 ， 屏 项 了 除 6、2 和 6 以 外 的 其 他 位 。 


ZUR PX Tu fe 
1 int lessí(double x, double y) 
2 Í 





3 return x « Y; 

4 | 

xA e CAI A EE FU НЕН: 

1 Па! 16(%ерр) Push y 

2 fcompl 8 *%ebp) Compare y:x 

3 InsLsw Фах Store floating point status word in бах 

4 апар $69, %аһ Mask ali but bits Ü, 2, and 6 

5 sete €al Test for comparison outcome of 0 (> 

6 novzbl $al,$eax Copy low order byte to result, and se! rest to 0 
练习 题 3.29 


请 说 明 ， 如 何 通过 在 前 面 的 代码 序列 中 插入 一 行 汇 编 代码 ， 就 能 实现 下 面 的 函数 
i (ізі greaLer(double x, double у) 
A [Í 
3 return X > y; 
400) 

现在 ， 我 们 就 讲 完了 用 1А32 进行 汇编 级 浮 点 编程 。 即 使 是 有 经 验 的 程序 员 也 会 觉得 这 些 代 偶 
很 神秘 ， 难 以 阅读 。 基 于 栈 的 操作 ， 将 状态 结果 从 ЕРИ 读 到 主 处 理 器 的 笨拙 ， 以 及 浮 点 计算 的 许 包 
细微 之 处 ， 都 使 得 机 器 全 码 元 长 而 降 涩 。 值 得 注意 的 是 ， 如 果 数 字 程 序 被 编码 为 指定 格式 ， 则 Intel 
和 它 的 音 争 者 们 生产 的 现代 处 理 器 就 能 够 使 这 些 数字 程序 达到 相当 高 的 性 能 。 
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在 早期 的 计算 中 ， 大 多 数 程序 都 是 用 汇编 代码 写 的 ， 即 使 是 很 大 型 的 操作 系统 也 是 在 没有 癌 级 
语 吉 帮 助 的 情况 下 编写 的 。 就 程序 的 复杂 性 来 说 ， 这 就 变 得 难以 管理 了 。 因 为 汇编 代码 不 提供 任何 
形式 的 类 型 检查 ， 所 以 很 容易 犯 基本 的 错误 ， 例 如 将 指针 作为 整数 来 用 ， 而 不 是 间接 引用 指针 。 刘 
烛 的 是 ， 用 汇编 写 代码 会 将 整个 程序 限制 在 某 一 类 机 器 上 了 。 重 写 一 个 汇编 语言 程序 ， 使 它 能 在 不 
同 的 机 器 上 运行 ， 与 从 头 写 整个 程序 是 ВРИЕ. 


mu. ШЇ КЕӨ ЕКЕН 

Frederick Brooks, Jr, AHERE RHEE, АБ TAT 05360 开发 的 说 明 .DS/360 < IBM 
机 器 的 一 个 早期 操作 系统 [5]， 直 到 今天 它 还 提供 了 很 多 重要 的 经 验 。 通过 写 这 些 东 西 ， 他 成 为 了 用 
高 级 诺言 进行 系统 编程 的 惠 心 拥护 者 不过， 念 人 慷 奇 的 是 ， 有 一 组 活跃 的 程序 呐 ， 他 们 很 高 兴 为 
[A32 写 江 编 代码 , 他 们 通过 Internet 新 闻 组 comp lang.asm.x86 AA k Ж. 他们 中 的 大 多 数 为 DOS 
操作 系统 编写 计算 机 游戏 ， 


早期 的 高 级 编程 语言 的 编 诬 器 不 能 产生 非常 有 有 效 的 代码 ， 也 不 能 提供 系统 程序 员 常常 需要 的 对 
低级 日 标 〔 代 码 ) 表示 的 访问 。 要 求 高 性 能 或 须要 访问 目标 《代码 》 表 水 的 程序 通常 还 是 用 汇编 代 
玛 来 号 的 。 不 过 现在 ， 优 化 编译 器 基本 上 上 使 得 性 能 优化 不 再 是 用 汇编 代码 写 程序 的 “个 原因 了 。 
个 高 质量 的 编 详 器 产生 的 代码 通常 和 手工 编号 的 一 样 好 ， 甚 至 于 更 好 。 而 5 语言 基本 上 使 得 机 器 访 
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IB] AN BHI SIT. Сан БИЕ ЕЛЕ le ИЕ CAR C OR. DUREE {УИГЕ K 
ЛАРЕ, Ж, А) K EGER i tt АЧ ОТЫН ДЕДЕ Л. DIUI. SR Linux 这 样 的 现代 操作 
系统 ， 几 和 平 每 个 部 分 郁 是 用 C ЕР]. 

FEAE, AERALA S REDRE- MAE, FAEERE Е A ВЕ. EW 
W, adka RU]. ERRA T ЛИР ҒӘК 8, DUET A LB Be TE ES HH 
特殊 的 指令 或 是 访问 特殊 的 存储 器 售 置 。 即 使 是 对 应 用 程序 员 来 党， 也 有 一 些 机 器 特性 ， 例 如 条 件 
ИН, ЖЕҢИЛ C 访问 的 。 

现在 的 问题 是 可 将 主要 出 习 组 成 的 代码 与 少 草 汇 编 代码 集成 到 一 起 。 一 种 方法 是 用 汇 续 代 凤 和 写 
ERRAR, МЕНІН ЕМЕНІ ТЕМЕН СЕНІ - 样 ， 这 些 汇编 图 数 保 企 在 独 
立 的 文件 中 ， 由 链接 此 将 纺 译 好 的 C 代码 和 汇编 好 的 汇编 代码 结合 起 来 。 例 如 ， 如 玉 文 件 plc 包含 
CRE: Hú fT ps УА Ro S FU. EA Sri > 


unix- gcc -o p p'i.c p2.s 


会 编译 文件 ple AIRA p2.s， 并 将 得 到 的 日 标 代 码 链接 形成 可 执行 程序 р. 


3.15.1 EHARA (inline assembly) 

GCC 还 可 以 将 汇编 与 C 代码 混合 起 来 .内 髓 汇编 允许 用 忆 直 接 往 编译 器 产生 的 代码 序列 中 捕 入 
汇编 代码 。 可 以 提供 一 些 特 性 ， 以 指定 指令 操作 数 和 辐 编 译 器 说 时 汇 编 指令 要 需 兽 哪 坚 寄存 路 。 汉 
然 , 得 到 的 民 公 是 与 机 器 高 度 相 关 的 ,因为 不 同类 型 机 器 的 机 器 指令 是 不 碰 容 的 .asm 命令 (direetive ) 
也 是 与 GCC 相关 的 ， 它 与 很 多 其 他 编 详 器 是 不 兼容 的 。 尽 管 如 此 ， 这 还 是 一 种 有 效 的 方式 ， 将 与 
НИН СЕ ЕНІ ЖАҚ 

МГ ЕА ОСС 信息 档案 的 一 部 分 来 说 明 的 ， 在 任何 安装 Y GCC 的 机 器 上 执行 命令 info 
асс, 会 得 到 一 个 分 层 的 文档 阅读 器 。 沿 着 名 为 “C Extensions” HHE, 然后 是 名 为 “Extended Asm” 
的 链接 ， 就 能 找到 内 局 汇编 的 文档 。 不 幸 的 是 ， 这 个 文 档 有 点 不 完全 ， 也 不 太 准 确 ， 

内 冉 汇 编 的 基本 格式 是 像 过 程 调用 一 样 写 代 码 ; 

asmi code-string ) ; 


术语 code-string 表示 一 个 以 带 括 号 的 字符 串 形式 给 出 的 汇编 代码 序列 。 编 译 器 会 将 这 个 字符 串 
一 子 不 荐 地 插入 到 产生 的 汇编 懂 码 中 , 因此 , 编译 器 提供 的 汇编 和 用 户 提 供 的 汇编 就 合并 到 一 起 了 ，。 
迪 详 器 不 会 检查 字符 串 是 否 出 错 ， 因 此 ， 要 等 到 汇编 器 才 会 报告 错误 。 

我 们 以 个 需要 访问 条 件 码 的 例子 来 说 明 asm IERI. ЖЕБЕП of: 

int ok smulíint x, int y, int *dest); 

int ok umulí(unsigned x, unsigned y, unsigned *dest!; 

SEP Еа И ЖИИ EE CORE y 的 乘积 ， 并 将 结果 存放 到 参数 desc 指定 的 存储 器 位 置 中 。 至 于 
ЖЕН, ЫН ЕМ 0, АЕЦ. 有 符号 乘 和 无 符号 乘 是 丙 个 函数 ， 因 为 它们 的 溢出 情 
Doe A F] HJ, 

分 机 1A32 乘法 指令 mul 和 imal 的 文档 ， 我 们 看 到 在 溢出 时 ， 两 个 指令 都 会 设置 进位 标志 CF. 
查看 名 3.10, 我 们 看 到 指令 setae 可 以 用 来 在 CF 标志 设 为 上 时 ,将 : -个 寄存 器 的 低位 字 节 设置 为 小 
否则 误 设 置 为 1。 因此 ， 我 们 希望 将 这 条 指令 播 入 到 编译 器 产生 的 序列 中 。 
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在 试 图 使 用 尽 可 能 少 的 汇编 代码 和 详细 分 析 后 ， 我 们 试 着 用 下面 的 代码 来 实 琉 ok. втш: 


— _—. -- — code/asm/okmul.c 
1 Æ First attempt. Does not work */ 
2 int ok smulií(int x, int y, int *des-) 
3 Í 
4 irt result = 0; 
5 
b *Gest = X*w; 
7 asmí"xetae Жа1"): 
B retura^ result; 
9 } 
— — ——— IU —- code/asm/okmul.c 


ВА E ЕЕ O ЕТЕ ЫНА ВО, АРЕНА КЕНЕ 
result， 第 一 行 就 会 将 这 个 寄存 器 设置 为 0。 内 帐 汇 编 会 插入 正确 设置 这 个 寄存 器 低位 字 季 的 代码 ， 
而 这 个 寄存 器 会 用 来 作为 返回 值 。 

不 替 的 是 ，GCC 有 它 自己 的 关于 代码 产生 的 想法 。 产 生 的 代码 并 不 会 在 函数 一 开始 时 就 将 寄 丰 
Roex 投 置 为 0， 而 是 到 最 后 才 这 么 做 ， 所 以 函数 总 是 返回 0。 最 根本 的 问题 是 ， 编 详 器 无 法 知道 
程序 员 的 意图 是 什么 ， 也 先 法 知道 汇编 语句 应 该 如 何 与 其 他 产生 的 代码 交 卫 。 

通过 -系列 党 坛 ( 待 会 儿 我 们 会 详细 介绍 更 加 系统 的 方法 )， 我 们 能 生成 可 行 的 代码 , 但 是 这 也 
不 太 理 想 : 


——— —— code/asmV/okmul.c 
1 /* Second attempt. Works in limited contexts */ 
2 int dummy = 0; 
3 
4 int ok smul2iirt x, int y, int *dest) 
2 1 
5 int result; 
J 
Б *dest = x*y; 
3 result = dummy; 
10 asm[("setae $al"); 
11 return result; 
12 } 
-一 一 -一 -一 — code/asm/olmnul.c 


这 段 代码 使 用 的 是 和 前 而 一 样 的 策略 ， 但 是 它 用 全 局 变量 dummy 的 值 来 将 result 初始 化 为 0， 
对 十 产生 包含 全 局 变量 的 代码 ,编译 器 通常 会 比较 保守 ， 所 以 不 太 可 能 会 重新 排列 计算 的 顺序 。 

前 面 的 代码 依赖 于 编 详 器 能 够 处 理 得 当 。 实 际 上 ， 只 有 当 编 详 器 的 优化 选项 【命令 行 选项 -O) 
是 打开 的 时 候 ， 这 段 代 码 才 能 正常 .[ 作 。 当 不 带 优 化 编译 时 ， 它 会 将 result 存 逆 在 栈 中 ， 在 返回 之 
BL, To setae 指令 设置 的 值 ， 编 译 器 无 法 知道 插入 前 汇编 语言 与 其 他 代码 之 间 的 关系 ， 因 为 
我 们 没有 提供 给 编译 器 这 样 的 信息 。 
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3.15.2 asm 的 扩展 格式 

GCC 提供 了 asm 的 一 个 扩展 版 本 ， 它 允许 程序 员 指定 哪些 程序 值 要 作为 汇编 代 友 序列 的 操作 
狼 ， 以 及 哪些 寄存 器 要 被 汇编 代码 蜂 兰 。 肥 了 这 己 依 县， 编译 器 产生 的 代码 就 腹 于 确 建立 所 乔 要 的 
А, ЖИТИ 25, 并 使 用 计算 出 的 值 。 这 些 信 息 中 还 包括 编 详 器 所 舌 的 关于 寄存 器 使 用 的 信息 ， 
这 样 -一 来 ， 重 要 的 程序 值 就 不 会 被 汇编 虑 码 指令 软 盖 了 ， 

扩展 的 汇编 序列 胸 通 用 语法 是 这 样 的 ; 

asmi cede-string | : output-list | : input-list (2 overwrite-list ] | ] Y; 

АН, Jia s kasuk Ж. IX Ps НН {ч Дд ЛАЙ ННІ ЕРЕН, БІНЕН АНЕ) 
dx. ШШ ОЯН МИР ЕДЕ ЖО. ША EAEL FOROR AED. DLL ARI ER 
Be A.X A RULBS СОЗ ТЕШУ S EB FIBER. 我 们 只 包含 到 最 后 一 个 诈 宝 的 列 
*. 

Wi BA EE: LE АЛЕ priu 语句 中 格式 化 字符 串 的 语法 。 它 是 由 一 个 用 分 号 UCILDm 分 隔 的 汇 
编 代 码 指令 序列 组 成 的 。 输 入 和 输出 操作 数 由 引用 免 0， 免 1，…， 锣 9 表示 。 操 作 数 是 根据 它们 第 一 
次 在 输出 列表 和 输入 列表 中 出 蚁 的 顺序 编号 的 。 司 “%eax” 这 样 的 寄存 器 名 学 必 须要 多 加 -一个 “多 ” 
е, RS "ea". 

FIEL ok smul H]— Sri krl, ЯЛЫ RET deii Н) ЖЕ УК VE TL T8 Е E ft 
result ЕКИН: 





code/asm/okmul.c 
1 є Uses extended asm to get reliable code */ 
2 int ok smul3í(iat x, int v, int *dest) 
3 { 
à int result; 
5 
5 *dest = x*y; 
, 
В ғ Insert the following assembly code: 
9 setae %bl # Set low-order byte 
16 туур %bl, result ft Zero extend to be result 
11 *j 
13 asm("setae $$51; movzbl %%Һ1,%0" 
13 : "sr" (result) 产 Output */ 
14 : /* No inputs */ 
15 : "%еБх" /* Overwrites */ 
16 1: 
17 
18 return result; 
19 } 
一 一 code/asm/okmul.c 





Ж-ЖЙЯНЕОНИПАНИ DE ЕЕН M A ЗЫ 中 。 然 后 ， 第 二 条 指令 对 这 个 值 进行 零 扩 
展 ， 并 找 贝 到 编 详 器 选择 的 用 来 保存 result 的 随便 哪个 寄存 器 中 ，result 是 用 操作 数 %0 表示 的 。 输 
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出 列表 是 出 以 空格 分 隔 的 值 对 组 成 的 。{ 存 本 例 中 ， 只 有 一 个 值 对 ,) 值 对 的 第 一 个 元 素 是 一 个 字符 
串 ， 表 明 操 作 数 的 类 型 ， 这 里 “r” 表 未 -一 个 整数 寄存 器 ， 而 “=” 表 示 汇编 代码 对 这 个 操作 数 进行 
TRE. CDS SS МЕЛ S TOROKIB BR EC. 它 可 以 是 任何 可 赋值 的 值 (在 C 中 称 为 左 全 ， 
lvalue )。 编 译 器 会 产生 必要 的 代 妈 序列 来 执行 这 个 峰值。 输入 列表 有 相同 的 道 用 格式 ， 这 里 所 作 数 
可 以 是 任意 C 表达 式 。 编 译 器 会 产生 必要 的 代 但 来 对 这 个 表达 式 求 值 。 短 盖 列 表 只 是 简单 地 给 出 会 
被 重 写 的 寄存 器 的 名 字 【《 必 为 带 括号 的 宝 符 串 )。 

碟 论 编译 选项 如 何 ， 前 面 这 段 代 码 都 能 正常 工作 。 正 如 这 个 示例 表明 的 那 伴 ， 要 编写 允许 操作 
数 按照 要 求 的 格式 书写 的 汇编 代码 ， 可 能 还 需要 “点 点 创造 性 的 思维 。 例 如 ， 设 有 直接 的 方法 来 指 
定 一 个 程序 值 作 为 setae 指令 的 是 的 操作 数 ， 因 为 这 个 操作 数 必须 是 单字 节 的 。 因此， 我 们 编号 了 
一 个 基于 一 个 特 萄 寄存 器 的 代码 序列 ， 然 后 用 … 个 额外 的 数据 传送 指令 来 将 得 到 的 值 拷贝 到 程序 状 
访 的 某 个 部 分 。 


练习 题 3.30 

GCC 提供 了 扩展 精度 运算 的 工具 . 它 可 以 用 来 实现 оқ smul Ж. ЖБ. ЖАТТАН ЖЗ, 
声明 为 类 型 "опр long” 的 变量 的 大 小 为 普通 lon EKAR. Bie. a 

long long prod = (long long) X * v; 


AT E xe y E 644138. 用 这 个 工具 ， 写 出 一 个 不 使 用 任何 asm #2] #] ok smul 版 本 。 


有 人 可能 会 想 ， 这 段 代码 序列 可 以 用 在 оқ umul rh, GE, XE ЕШ АЛ S dE. GCC 用 的 
Ab imull CHITI 3808) 指令 。 昔 然 写 能 为 两 个 习 法 部 产生 下 确 的 值 , 但 是 它 会 根据 有 符号 滋 法 的 
规则 来 设 早 进位 标点 。 因 此 ， 我 们 天 要 使 用 汇编 代码 序列 ， 显 式 地 用 图 3.9 中 说 明 的 таш! 指令 来 执 
ITE ЕА, АБАШ КТ: 


—————— — — eiide/asm/okmul.c 
1  /*Usesextended asm */ 
à int әк umulíunsigned x, unsigned y, unsigned *dest) 
3 [Í 
á int result: 
5 
6 f* insert the following assembly code: 
7 mov] x, %eax # Get x 
8 mul] y # Unsigned multiply by v 
9 mov] 96eax,*dest # Store low-order 4 bytes at dest 
10 setae 65d] # Set low-order byte 
11 movzbl %dl, result # Zero extend to be result 
12 ж/ 
13 asm("movl %2,%%Жсах; mull $3; mov] %%еах,%0; 
14 setae tidl; movzbl %%d31,%1" 
15 | "zr" [*dest), "=r" (result) /* Outputs */ 


4 Xs E. ЭЦ ССС 声明 ARED char 的 变 昌 来 声明 一 个 单字 节 拘 作 数 ， 参 见 httpi/www.csapp.cs.cmnu.edu/public/ 
byteasm.html, - -一 译 者 
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16 : "Г" dx), "rz" {Y} i* [nputs */ 
17 | "%едх", "Фейх" /* Overwrites */ 
18 ) 

19 

20 return result; 

2_ ] 


coderasm/okmul.c 


回忆 `F. mll 指令 要 求 它 的 一 个 参数 仁 寄 存 器 各 eax 中 ， 而 第 一 个 参数 是 作为 操作 数 丛 出 的 。 
为 了 说 明 这 一 点 ， 在 авт 语句 中 ， 我 们 用 movl 将 程序 值 x 传送 到 名 eax， 并 指明 程序 值 y 是 mull fü 
令 的 参数 ,然后 , 指令 会 将 8 个 字 节 的 习 积 存放 在 岗 个 寄存 器 中 ，%eax 保存 低位 4 “ЕЛИ, Т ебх 
RFA. КЕВИН E bed 来 构造 返回 值 。 工 如 这 个 示例 说 明 的 那样 如 号 ,用 来 
在 :输入 和 输出 列表 中 分 隔 操 作 数 对 ， 以 及 在 覆盖 列表 中 分 陋 寄 存 器 名 字 。 注 意 ， 我 们 能 够 糙 *dqest 
肯定 为 第 二 个 mol 指令 的 输出 ， 因 为 它 是 可 赋值 的 . TE Aaen E ERN, Hea 
"P Brie fr fb FX T ER a Б. 

AB Тїн ade ann P^ T. asm 语 铭 的 代码 的 ， 下 面 是 为 ok_umul 产生 的 代码 : 


Set up asm inputs 


1 movi Е(%ерр) , зесх Load х into ecx 
2 movi 12 {%ерр!, Ұерх Load y into ebx 
3 movl 16 {%ерр!, Феѕі Load dest inio "cesi 
The following instructions were generated by asm. 
Input registers: Фесх for x, %ebx for y 
Output registers: Фесх for product, Webx for result 
4 movi *ecx,&eax; mull £ebx; movl %еах,%есх; 
5 setae %41; movzbl %31,%ebx 
Process asm оніриіх 
6 movl $ecx, (&esi) Store product at dest 
7 movl %ерх,%еах Set result as retum value 


ARARAS 1—3 行 取出 过 程 参数 ， 并 将 它们 存放 到 寄存 器 中 。 注意, CRAEN DA Феах 
或 旬 edx， 因 为 我 们 已 经 声明 了 这 两 个 寄存 器 会 被 重 写 。 第 4 行 和 第 5 TRU PIERII AS, Ж 
过 参数 换 成 了 寄存 器 的 名 宅 。 特 别 地 ， 它 会 用 寄存 器 和 ecx 代替 参数 名 7 (x), ЮН ерх 代替 参数 叱 3 

(y)。 乘 积 会 暂时 存放 在 %ecx 中 ， 而 它 会 用 寄存 器 和 ebx 代 蔡 参数 免 ] (result), 然后， 第 611838 
积存 储 到 dest， 完 成 了 对 参数 %0 (rdest) 的 处 理 。 第 ? 行将 result 拷 刺 到 寄存 器 各 eag， 作 为 返回 值 ， 
内 此 ， 编 详 器 不 仅 产 生 了 我 们 asm 语句 指示 的 代码 ， 还 产生 了 提供 语句 输入 《第 1~3 £0 和 使 用 
输出 【第 6~- 了 行 ) BERI, 

BA asm 语 梧 的 语法 有 点 难 情 ， 而 下 它 的 使 用 也 使 代码 的 可 移植 性 变 莽 了 ， 但 是 对 于 编写 用 
少量 汇编 代码 来 访问 机 器 级 特性 的 程序 ， 这 条 语句 还 是 非常 有 用 的 。 我 们 发 现 ， 要 想 代码 能 正常 
工作 ， 是 需要 进行 一 些 尝试 和 犯 虑 错误 的 。 最 好 的 办 法 就 是 用 -$ 选项 编译 选项 ， 然 后 检查 产生 出 
的 谍 编 代码 ， 看 它 是 否 达 到 了 期 望 的 效果 。 民 码 还 应 该 用 不 同 的 选项 设置 来 测试 ， 例 如 带 和 不 带 
-0 选项 。 
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ESET, RIRI Y a sun НЕЕ НЫН Е КНР, ELI ЛЕЙ ДН. ЖОЛ es 
ЕЕЕ НЕ, ЖТ РЕАКТИВ Л, АНАМЫ. КЕ 
HERHOR. ERSEN, ЖЕЖ, МЕНИН SUELE ЕЕЕ, Г ТЕД 
特性 会 有 六 帮助。 我们 还 看 了 一 些 总 级 语 吉 抽 彰 隐 藏 有 关 程 序 操作 重要 细节 的 例子 。 例 如 ， 浮 点 代 
妈 的 行为 可 能 依赖 于 值 是 悍 存 在 寄存 器 中 , 还 是 在 存储 器 中 。 在 第 13 章 中 , 我 们 会 看 到 许多 这 样 的 
例子 ， 我 们 渍 要 知道 -个 秩序 变量 是 在 运行 时 本 中， 是 在 某 个 动态 分 配 的 数据 结构 外， 还 居 在 某 个 
全 局 夺 储 和 位置 中 。 理 稻 程序 是 如 何 映射 到 机 器 上 的 ， 会 让 理解 这 些 存 情 之 间 的 区 别 容易 d. 

汇 继 语言 与 局 代 公 差 别 很 太 。 在 汇编 语言 程 字 中 ， 各 种 数据 类 型 之 间 的 差别 很 小 。 程序 是 以 指 
令 序 列 来 表 水 的 ， 每 条 指令 都 完成 一 个 单独 的 操作 。 部 分 程序 状态 ， 男 寄存 器 和 运行 时 栈 ， 对 程序 
员 来 网 是 直接 可 见 的 . 仅 提供 了 低级 汇 作 来 女 持 数据 处 理 和 程序 控制 。 编 洋 器 必须 用 多 条 指令 来 产 
生 和 操作 各 种 数据 结构 ， 来 实现 像 条 件 、 循 环 各 过程 这 样 移 控制 结构 。 我 们 讲述 了 CC EHRE C 
的 证 多 不 本 方面。 我 们 看 到 CC 中 缺乏 边界 窒 查 ， 使 得 许多 程序 容易 出 现 缓冲 区 溢出 ， 而 这 已 经 使 许 
E Gg E AGERE Ad 

RIRA CS TA32 VIE. (3 {ЕЗ {ИҢЕ А SSAA BLA Ж ЖИДЕШ Ө ЖИП REOR 
18у. Bim, Mif C++ 与 编 详 C ШЕНІ. SEES E, Ce ЯЗ: Н ДЕТ ODIT ГА C++ 
天性 的 源 到 源 的 转换 ， 并 对 结果 送行 СРЕ, РЕНЕ. Сн. НМ Е л, Р 
C 的 stmct。C++ 的 方法 是 用 指向 实现 方法 的 代码 多 指 针 来 表示 的 。 相 比 向 言 ，Java 的 实现 方式 完全 
^id. Java 的 日 标 代 码 是 一 种 特殊 的 二 进 制 表 水 ， 称 为 Java 字 节 代码 。 这 种 代码 可 以 看 成 是 虚拟 机 
的 机 器 级 程序 。 止 如 它 的 名 字 瞳 水 的 那样 ， 这 种 机 器 并 不 是 直接 用 硬件 实现 的 。 ЖЫ, КЕ 
处 理 衬 市 代码 ， 模拟 庶 拟 机 的 行为 。 这 种 方法 的 优点 是 相同 的 Java 字 节 代码 可 以 在 许多 不 同 的 机 器 
上 执行 ， 而 我 们 在 本 至 谈 朋 的 机 器 代码 只 能 在 1A32 上 运行 。 


参考 文献 说 明 

XTIA32 最 好 的 参考 书 日 来 良 于 Intel. 他们 关于 软件 开发 能 系列 中 有 下 本 特别 有 用。 基本 体 
系 抽 构 手 册 [8] 给 出 了 从 汇编 语言 程序 员 有 角度 来 看 的 体系 结构 概 通 ,而 指令 集 参 性 手册 [19] 给 出 了 各 
种 指令 的 详细 描述 。 这 些 参 考 书 日 包含 的 信息 延 近 超出 了 理解 Linux 代码 所 需要 的 内 容 。 特别 地 ， 
Linux 使 用 平面 模式 寻 址 ， 所 有 分 段 寻 址 方法 的 复杂 性 都 可 以 不 予 兰 虑 了 。 

Linux Е GAS 格式 与 Intel 文档 中 以 及 其 他 编 详 器 (特别 是 Microsoft 生产 的 编译 器 ) 
使 用 的 标准 格式 差别 很 大 。 一 个 主要 区 别 就 是 源 和 日 的 操作 数 是 以 相反 的 顺序 给 出 的 。 

(Е Linux BL3& Б, ЕЛ а 2 infoa 会 显 赤 有 关 汗 峰 器 移入 息 。 其 中 一 个 小 部 分 说 明了 与 机 器 相 
ХИ E. mH GAS 与 更 标准 的 Intel 表示 法 的 比较 ， 注 意 ，GCC 称 这 些 机 器 为 “i386” 一 一 它 产 
生 的 所 三 长 全 于 可 以 在 1985 年 的 机 器 上 上 运行。 

Muchnick 的 大 于 编 评 器 设计 的 著作 [55] 被 认为 是 有 关 代 码 优化 技术 最 全 面 的 参考 文献 。 它 检 羡 
了 我 们 在 此 讨论 的 许多 技术 ， 例 如 审 存 器 使 用 规则 和 基于 do-while 格式 为 循环 产 上 代码 的 优点 。 

ATEI Intemet 用 缓冲 反共 出 来 攻击 系统 ， 已 经 有 很 多 论述 了 。Spafford[?3] 出 版 了 关于 1988 
和 Internet 蜂 虫 的 详细 分 析 ， 帮 助 制止 这 种 蜂 忠 传播 的 МІТ 的 一 些 人 也 出 版 了 一 些 论 黄 [26]， 从 那 
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以 后 ， 产 生 了 许多 关于 制造 和 祯 防 缓冲 区 洲 出 攻击 的 论文 和 项 目 ， 例 如 [20]。 


家 庭 作业 
3.31 * 
给 你 如 下 信息 。 


个 图 数 的 原型 为 


int decode2[int x, int y, int z); 


将 这 个 函数 编 详 成 汇编 代码 。 代 人 码 体 为 ， 


imull 
aall 


сз р (л үг нъ ышк B ҥе 


movl 15 (%ерр}, *еах 
movi 12 {%ерр), tedx 
subl eax, %ейх 
movl &edx,*eax 


3(*Sebpl),$edx 


531,$eax 
Sarl 531,%Феах 
xorl %ейх,Феах 


参数 x.y 了 和 了 仔 放 二 存储 器 中 相对 于 霄 存 器 免 ebb 中 地 址 但 移 量 为 8、12 和 16 的 地 方 。 代 但 将 
返回 值 存 放 在 寄存 器 %eax 中 。 

与 出 等 价 于 我 们 汇编 代码 decode2 的 CC 代码 ,可 以 通过 用 -S 选项 编 详 你 的 代码 来 测试 你 的 答案 。 
你 的 编 详 圳 产生 的 代码 不 定 完 全 一 样 ， 但 是 功能 应 该 等 价 
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下 面 的 CR 代 色 基本 .上 与 图 3.12 中 的 代码 相同 ， 


1 int absdiff2í(int x, int v) 
2 [Í 

i int result; 

4 

5 if (X < y! 

б result = y-x; 

7 else 

9 result = x-y; 

9 return result; 

10 j 

不 过 编译 时 ， 它 得 到 形式 不 同 的 汇编 代码 : 
1 movl 8{%ерр},%ейх 

2 movl 12 (Зерр),Фесх 

3 movl Зейх,%сах 

4 subl %есх,%еах 

5 cmpl Жесх,%сіх 

5 jade .L3 

7 movl Җесх,%еах 

8 subl %ейх,%еах 

9 „L3: 
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A， 当 x<y , ДАС ТЕЕ? 03 x2y ЕЕ? 

B. 这 段 代 码 与 前 面 讲 运 的 if-else 的 标准 实现 有 和 什么 不 同 ? 

C. H C iE fi goto)， 给 出 这 个 翻译 的 通用 形式 ， 

DD， 为 了 保 让 这 个 翻 详 共有 代码 指定 的 行为 ， 右 对 它 的 使 用 加 上 上 什么 样 的 限制 ? 
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站 面 的 代码 给 出 了 :个 开关 语句 中 根据 枚 举 类 翰 值 进行 分 支 选 择 的 倒 。 回 忆 cp. C Ч 
类 型 只 是 一 种 引入 -- 组 与 整数 值 相对 应 的 名 子 的 方法 ,默认 情况 下 , 值 是 从 0 In) Ef KW; b YP), 
ERARI, WEST S ЖТТ MES (case labels) 由 对 诺 的 动作 。 

1* Enumerated type creates set of constants numbered © and upward */ 


typedef enum (MODE А, MODE B, MODE C, MODE D, MODE E) mode t; 


int switch3(int *pl, int *p2, mode t action) 
{ 

int resuli = 0; 

switch(action) Í 

case MODE A: 


Case MODE B: 
Case MODE C: 
case MODE D: 
case MODE E: 
default; 


} 
return result; 
} 


产生 的 突现 各 个 动作 的 汇编 代 佑 部 分 如 图 337 所 示 。 ТЕЙ ЖД Т {ИТЕ {ТЯН МИН. UR 
ЖӘНЕН ЕН ЯЗ. 
А, ЕҤ ЛЕШ result 对 应 于 哪个 寄存 器 ? 
B. His IB C 代码 中 缺失 的 部 分 ， 注意 会 落 入 其 他 情况 (cases》 的 情况 (case)。 
The jump targets 
Arguments pi and p2 are in registers Webx and Фесх. 


1 115; MODE À 

2 movl (tecx),Ssedx 

3 movl {%ерх),%еах 

4 movl eax, (Зесх) 

5 jmp .L14 

6 .p2align 4,,7 Inserted to optimize cache performance 
7 „LIS: MODE B 

3 


тоу] {%есх),%еах 


addl (€ebx),Xeax 
movi Зеах, (ebx) 
movl £€eax,*edx 
jump Ll4 
.p2alian 4,.7 
„LİF: 
movl $15, {ebx} 
movl (ecx), 3edx 
imp .L14 
.p2alicon 4,,7 


LIE: 


шоу] ;.€ecx),teax 
movl %сах, (*&ebx) 


‚11195; 


поч] 517,%ейх 
jmp „114 
‚рга11дп 4,,7 


120: 


movl 5-1,Жейх 
„114: 
теі *edx,£teax 


这 段 代 妈 实 现 广 switeh iB ІНЕ x. 
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Inserted to optimize cache performance 
MODE C 


Inserted to optimize cache performance 
MODE D 


MODE E 


Inserted то optimize cache performance 


default 


Set return vulue 


图 3.37 作业 3.33 的 汇编 代码 
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HTA КИН m L EKK. ЖЕНЕ ИШ. E КАХА, БІН 
庄 句 的 主体 ; 

] int switch probíint x) 

à Í 

3 int result = X; 

4 

5 switchix) Í 

2 

7 Р Fill in code here */ 

8 } 

9 

10 return result; 

11 ] 


图 338 给 出 的 是 这 个 过 程 的 反 汇 编 日 标 代 码 。 我 们 只 对 第 4~16 行 所 示 的 代码 部 分 感 兴趣 。 在 
第 4 行 我 们 可 以 看 到 参数 《〔 在 相对 于 免 ebp 偏 移 量 为 8 HAE WRIA GTS peax 中 ， 对 应 于 
程序 变量 result. 8 11 行 的 指令 lea CxO($esi), &esi 是 一 条 空 指 令 ， 插 入 这 条 指令 是 为 了 使 
第 纪行 的 指令 的 起 始 地 址 为 16 КИЕ. 


1 080483с0 «switch prob»: 

2 80483c0; 55 push %ерр 

3 80483ci: 89 е5 mov %евр,%еһр 

4 504832: Bb 45 08 mov бхЯ [šehbpl, ћеах 

5 80489366: 84 50 ce lea Üx£ffffffce(teax),tedx 

b 804831c9: 83 fa 05 стр Suxo, pedr 

7 80483cc: 77 1d за 80483eb «switch ргор+0х2р» 
a 80483ce: ҒҒ 24 95 68 84 04 08 jmp *üxSC18468(, becx, 1) 

9 8049345: cl ей 02 shi 50х2,Феах 

19 8048348: eb 14 ] mp 80483ee zswitch ргор-Йх2е> 
11 580483da: 8c bé Ой 00 gü Jü lea 0х0 іЗеві),%еві 

12 80483eD: cl ЕВ 02 Sar S50x2,*e6ax 

13 8048363: eb 09 jmp B)483ee «switch ргор+0х2е> 
14 8D483e5: 8а 04 40 lea (%еах, %еах, 2), ћеах 

15 80483e8: Üf af ců imal teax,$eax 

18 80483ер: 83 có ба add 5Јха, %еах 

17 804B83oe: BU ec mov ЖеБр,Февр 

18 8048310: 5d pop %ерр 

19 80483f1: с) ret 

20 H04B2f2: 89 ЕБ mov Sesli,*esi 


3.88 作业 3.34 的 反 汇 编 代 码 


BRA ER ipfe dm. БА GDB， 我 们 可 以 用 命令 vow 0x8048468 Ж 
器 中 从 地 址 0x8048468 开始 的 六 个 4 字 节 的 字 。GDB 打印 出 下 面 的 内 容 ; 


(дар) wow e048465 

0x8048458: 0х08048245 0х080483еЬ 0x080483d5 0х080483еб 

0x8048478:  0x080483e5 0x080483eB 

Дарс) 

H C VIP АН ЕЖ, Bn A SB 

335 ФФ 

Ся var_prod_ele "^^: figo. (A 3.250) 不 是 最 优 的 。 根 据 过 程 fix. prod. ele. opt (Ж 
3.24) 和 var prod ele opt (Ë 3.25), "5 Hx T 8 8089 EU. EZA n 的 所 有 人 都 正确 ， 但 是 编译 
PER) ES SEDES TE PPS ls ЖӨН DC CE mh 

四 局 一 下 ， 处 理 器 只 有 六 全 寄存 器 可 用 来 保存 临时 数据 ， 因 为 寄存 器 免 ebp ЖІФезр 小 能 用 于 此 
ПЕ Аң -个 寡人 存 器 还 必须 用 来 保存 乘法 指令 的 结果 。 因 此 ， 你 必须 把 循环 中 的 局 部 变量 的 数量 
Ms (result. Арт. В. nTjPk, n 和 ent) 减少 到 五 。 

3436 ФФ 

XA fot edP ARR C 程序 ， 遇 到 下 和 面 这 样 的 代码 ; 

l typedef struct 1 

2 int left; 

3 à struct a[CNT]; 
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4 irt right; 

5 ) b struct; 

6 

+ уяна LtesL(int i, b struct “Бр; 

8 { 

9 int n = bp-»left + bp-»right; 
10 a struct Жар = &bp-»-a[il: 

11 ар->х[ар->ійх] = n; 

12 ) 


不 幸 的 是 ， 你 对 定义 编译 时 常数 CNT 和 结构 a_struct 的 “.h” 文件 没有 访问 权限 。 幸 好 ， 你 能 


党 访问 代码 的 “,o” 版 本 ， 可 以 用 objdump 程序 来 反 汇编 这 些 文件 ， 得 到 如 图 3.39 所 未 的 扩 汇 编 代 
Б. 


1 00600000 «test: 

2 Ü: 55 push ebp 

3 1 89 er mov Фе»р, %ерр 

4 3 53 push $ebx 

5 d: Bb 45 OB mov CxB(&ebp) ,eax 

5 7: ар 44 бс mov Cxe t$ebp) , $ecx 

7 а во 04 80 lea (Ұсах,%еах,4),%еах 

8 3: 82 44 81 04 lea Üxd(tecx,teax,i],$eax 
9 1i; 3b ІС mov (&eax) , tedx 

ІП 13: сі е2 02 shl 0x2, *edx 

11 16: Әр 9$ ра 00 00 00 тоу üxb8it*ecx),*ebx 

12 1с: 03 18 add {Фесх) ‚ерх 

13 1e: 88 5c 02 04 mov Ферх,0хі (Фейх, ъеах, 1} 
14 22: Sb pop Ферх 

15 23: 89 ес тоу telp, besp 

16 25: 5d pop tebp 

17 265: c3 rec 


8339 作业 3.36 的 反 汇 编 代 三 

运用 你 的 道 向 工程 技能 ， 推 断 出 КУЈУ: 

A. CNT 的 值 。 

B. 结构 a_struct 汐 完 整 声 时 。 人 很 设 这 个 结构 中 只 有 域 idx RI x. 

3.37 ф 

985—160 good_echo， 它 从 标准 输入 读 入 一 行 ， 骨 号 回 到 林 准 输出。 你 的 实现 必须 对 任意 
长 度 的 输入 行 都 能 正常 工作 。 可 以 使 用 库 函 数 feets， 但 是 必须 保证 ， 你 的 函数 即使 荐 在 输入 行 需要 
比 你 为 继 冲 区 分 配 的 空间 更 大 的 空间 时 ， 仍 能 正确 工作 。 你 的 代码 还 应 该 检查 出 错 条 件 ， 当 退 到 错 
误 时 返回 ， 头 于 标准 VO 函数 的 定义 可 以 参考 文档 [32，40]。 

338 €49€6 

ftx um. ЖЕ ЖАЙНАШ ӘЛ ЖТТ ЧЧхХЖ ЕТЕ. ҮНІНЕН, ӨТІЛІН 
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用 这 种 或 其 他 形式 的 下 而 来 闭 得 对 系统 的 未 被 授权 的 访问 ， 但 是 通过 这 个 练习 ， 你 会 学 到 许多 关于 
ЯЛЕ ЖЕН ЖН. 

从 CS: APP 的 网 站 РУТЕ bufbomb.c, Е А ap fT x £P. E pufbomb.c Ч, К 
ДЕ, Fihi IER 44: 


1 int getbuf(! 


2 1 

3 char bufíl12l; 

4 getxsibut); 

5 return 1; 

5 ] 

7 

8 void testi) 

9 í 

10 int val; 

11 printfi"'Type Hex strinqg:")]; 


12 val = getbu£í); 
13 printf("getbuf returned üxgxin", val); 
14 | 
ЖЖ getxs (也 在 bufbomb.c 中 ) XAT PEHR рев, КГ АБЫ ТУШ ТАН 8 0375 s ue 
入 字符 的 以 外 。 比 如 说 ， 要 给 它 … 个 字符 串 “0123"， 用 户 应 该 输入 字符 串 “30 3132 33. KiK 
数 会 忽略 空格 字符 。 同 忆 下， 十 进 制 数字 x 的 ASCI 表示 为 0x3x。 
这 个 称 序 的 典型 执行 是 这 样 的 ; 
unix> Jbufbomb 
Type Hex string: 20 31 32 33 
gekbuf returned 0х1 
看 看 getbuf РАЖ КИМИ. E EET TRUE S. ҖИТТЕ EORR. ЕБИ T. 8 EXE 
НАЛ ре 没有 产生 效果 一 样 。 你 的 任务 是 ， 只 简单 地 对 提示 符 输 入 一 个 适当 的 十 六 进 制 字符 串 ， 
就 使 getbuf 对 test 返回 -$559038737 (Oxdeadbeef), 
КЖЕ Ил TEE CUR ICT LA: 
• H] OBIDUMP 创建 bufbomb 的 一 个 反 拒 编 版 本 。 和 仔细 研究 ， 确 定 getbuf 的 栈 帧 是 如 何 组 织 
的 ， 以 及 溢出 的 缓冲 区 会 如 何 收 变 保 存 的 穆 序 状态 。 
. 在 GDB 下 运行 你 的 程序 。 在 getbuf 中 设置 -个 断 点 ， 并 运行 到 该 断 点 。 傅 定 像 名 ebp 的 值 
这 梓 的 参数 ， 以 及 已 保存 的 当 缓 冲 区 溢出 时 会 被 覆盖 的 所 有 状态 的 值 。 
ОТТАР Е ERES. m HO EIE. ШӘЛІ ЖА ТЕ, 
写 一 个 汇编 代码 文件 ， 包 人 沼 想 要 放 入 栈 中 的 指令 和 数据 ， 用 GCC Y AK ИШ. ЕН 
OBJDUMP 反 蕊 涡 它 ， 总 可 以 获得 要 在 提 朱 符 处 输入 的 字 节 序 列 了 。 当 OBJDUMP 试图 反 
iL 编 你 文件 中 的 数据 时 ， 它 会 产生 一 些 看 上 上 去 非常 奇怪 的 指令 ， 但 是 十 六 进 制 字 节 序列 应 
该 是 正确 的 。 
要 记 住 , 你 的 攻击 是 非常 依赖 于 机 器 和 编译 器 的 。 当 运行 在 不 同 的 机 器 上 或 使 站 不 同 版 本 GCC 
时 ， 可 能 需要 改变 你 的 字符 串 。 
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339 ФФ 

用 asm 语句 来 实现 一 个 具有 如 下 原型 的 负数 ， 

void full vmuliunsigned x, unsigred y, unsigned dest[]); 

XC RACE VE BOULE & ФЕ 64 让 乘积 ， 并 将 结果 存储 到 日 的 数组 中 ，dest[O] 存 如 低位 4 + 
T. ІП фе ИКЕ 4 个 字 节 。 

34) ФФ 

fscale 指令 计算 浮 点 值 x 和 YY BIER ұлт", JX H RTZ ЖҰЛЫН 0 А. Cround-toward-zero? Ё 
Ж, WEISEN КА, ТОА А А. fscale 的 参数 来 自 于 浮 点 寄存 器 栈 ，x ЕО), m у 
fESest( LP „Ж ИЯ ЖЩ ЖҰНАНЫ А бово), 木 弹出 第 一 个 参数 。( 这 个 少 令 的 实际 实现 贺 是 将 RTZ(y) 
加 到 x 的 指数 ,》 

M asm 实现 一 个 函数 ， 它 的 原型 为 

double scale!double x, int n, double *dest); 

Н fscale 指令 来 计算 x .2"， 并 将 结果 保存 到 由 指针 dest 指定 的 位 置 。 扩 展 的 asm 对 IA32 学 
点 的 支持 不 是 很 好 。 和 不 过 ， 在 这 种 情 说 中 ， 你 可 以 从 程序 栈 中 访问 参数 。 


练习 题 答案 


练习 题 3.1 €x 
这 个 练习 使 你 熟 严 各 种 操作 数 格 式 。 






AE 


练习 题 3.2 "E 

X TEE -种 理解 系统 的 好 方法 。 因此， 我 们 想 要 逆转 C 编译 器 的 效果 ， 来 确定 什么 样 的 安 
代 但 会 得 刘 这 样 的 汇编 代码 。 最 好 的 方法 是 进行 “模拟 ” 开始 时 ， 值 x、y 和 = 本 别 在 指针 хр. yp 
和 2р 指定 的 位 置 。 于 是 ,我们 可 以 得 到 下 而 这 样 的 就 于， 

1 movi 8{%еор),%ед1 хр 


2 тоу] 12($ebp),$ebx ур 
3 movl 16{łebp),$esi zp 
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4 movl (Sedil],$eax X 
5 movl 1Жерх),%ейх y 
6 movl іЖеві),Жесх z 
7 movl Феах, (kebs) *yp = x 
8 movl edx, {%еѕі) кр = у 
9 movl Зесх,|%есі) “Хүр-2 


由 此 我 们 可 以 产生 上 而 这 样 的 C 158: 





code/asmidecode I -ans.c 
1 void decodelí(int *xp, int *yp, int *zp) 
2 Í 
3 int tx = *xp; 
4 inL ty = *'vp; 
5 int lz = *zp; 
б 
G Жүр = tX; 
% *zp = бу; 
9 *xp = tz; 
10 ) 

code/asm/decode I -ans.c 
练习 题 3.3 答案 


这 个 练习 说 时 了 leal 指令 的 多 样 性 ， 同 对 也 让 你 练习 解读 各 种 强 作 数 形式 。 注意， 虽然 存留 3.3 
中 有 的 操作 数 格式 被 划分 为 “存储 器 ”类 型 ， 但 是 并 没有 访 存 发 生 ， 


X, х+4 














, 


leal Ў[%Жеах Xecx,z ),&edx 


练习 题 3.4 答案 
这 个 练习 使 你 有 机 会 检验 你 对 操作 数 和 算术 指令 的 理解 。 


ж е [e] a 
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练习 题 3.5 答案 
ak 2] hk S ЕА СА. «ЖЕП VSE IH GCC 生成 的 ， 将 参数 n WRIA 
hec P. ЕНІНЕН ӨСІ 来 指定 зап 指令 的 移 位 量 . 


1 movi 1214%ерр),Жесх Getin 

2 movi 8í&€ebp!,teax Get x 

3 Sall $S2,8eax x««-2 
4 sarl %с1,%еах X»»-H 
练习 题 3.6 答案 


A B ЖЕНЕ Т ех UE 0, 运用 了 对 任意 x， xAx=0 这 一 局 性 。 它 对 应 于 C 语句 
i 2. 
АНЫН НА СЭВ, МЫННАН ЖОЕЛ КНН ERIS. Ws 
JRA, PRAA RABE FEF. 

练习 题 3.7 答案 

这 个 例子 昌 求 你 思考 不 同 的 比较 和 set 指令 。 野 注意 的 主要 问题 是 ， 如 果 将 比较 指令 一 这 的 什 
强制 甘 型 转换 成 了 unsigned， 那 么 由 于 隐 式 的 强制 类型 转换 ， 比 较 指 令 的 执行 就 好 像 两 边 部 是 无 符 
导数 HE. 


1 char ctestí(int а, int b, int c] 

2 i 

3 char tl = a < b; 
4 char t2 = b < [unsigned] а; 
5 char 3 = (вһог) С >s (short) a; 
6 char -4 = icharl а іг (char) с: 
7 char t5 = Co» b; 
8 char tü = а > 0; 
9 return tl + t2 + t3 + td + ts + t; 

10 | 

练习 题 3.8 ЕЖ 


X88 2] CRAT КИЕ САИН, 并 推理 出 跳 转 月 标的 编码 。 它 还 使 你 练习 了 十 六 进 制 算术 。 

А. jbe 指令 的 日 标 为 0x8048dle + 0xda。 如 原始 反 汇编 代码 所 示 ， 这 就 是 OxS048cf8. 

804841: 76 da ibe BOÜABCIS 

80488416: eb 24 jmp 048334 

B. ЛАЙ EIER, ЕКЕП pde {КЕНИН 0x8048d44。 根据 字 节 编码 ， 这 必须 是 在 超 
过 mov 指令 地 址 0x54 字 丫 地址 的 地 方 。 减 去 0x54 就 得 到 0x8048c 旬 ， 反 汇编 代码 也 证 实 了 这 一 点 : 

BÜü4Bcee; eb 54 јтр 8048444 

8048cFu: c? 45 f8 10 00 mov SO0x10,0xfffffffS8(tebp) 


C. Ня МО F 0x8048907 (пор 指令 的 地 址 ) 偏 移 量 为 000000cb 的 邮 方 。 对 它们 求 和 就 得 
PIHS 0x80489d2。 
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8048902; е? cb 00 00 00 jmp 8048942 

8048907: 90 пор 

D. [pie ЕЦ 25 & АБЫ. FERME CELERE Н КЕЛИШИН ЕИ 4 ТЯ 
Н. БАН АД АҚЫНЫ, ВТР Е Е е0 a2 04 08, 

8048320: ҒҒ 25 еб a2 04 јтр *0х804а2еб 

804835: 08 


练习 题 3.9 答案 
对 汇编 代码 写 注释 ， 以 及 模仿 它 的 控制 流 来 编写 C 代码 ， 旦 理解 汇编 语言 程序 很 好 的 手段 。 本 
题 使 你 能 够 练习 - "个 具有 简单 控制 流 的 4: 例 。 它 还 给 你 了 -- 个 检查 逻辑 操作 实现 的 机 会 。 
A. 
mm code/asmvimple-if.c 


void condíint a, int *p) 
{ 
it ір == G) 
goto done; 
if (a <= Q) 
goto done; 
* += а; 
done: 


) 


м (о —] o gm АП ou L2 [D 一 


А ——————— ———  cqode/asm/simple-if.c 


B. 4- Ж Л ЖЕ АА ЗЕН A WRA р ІРЕК ЖҚ, RSL а>0 
的 测试 。 


练习 题 3.10 答案 

网 详 循环 产 牛 的 代码 可 能 会 难以 分 析 ， 内 为 编 详 器 会 对 循环 代码 进行 很 多 不 同 的 优化 ， 还 因为 
程序 变量 与 寄存 器 的 匹配 非常 困难 。 我 们 从 非常 简单 的 循环 上 开始 练习 这 种 技能 。 

A. 只 要 看 看 是 如 何 取出 参数 的 ， 就 能 确定 寄存 器 的 使 用 。 





В. body-statement 部 分 是 由 С 代码 中 的 第 4—6 行 和 汇编 代码 中 的 第 6--8 行 组 成 的 。test-expr 
部 分 是 CC 代码 中 的 第 7 行 。 在 汇编 代码 中 ， 它 是 由 第 9 一 14 行 的 指令 以 及 第 15 行 的 分 支 条 件 组 成 
的 。 

C. 加 了 注 群 的 代码 是 这 样 的 ; 


Initially x, y, and n are at offsets 8, 12, and 16 from %ebp 


程序 的 机 器 级 表示 205 


1 movl 8[*ebp),€esi Put x in Фея 

2 movi 12($ebp),*ebx Putyin %eby 

3 movl l6[*ebp),£eczx Рип іп Фесх 

4 .pzalign 4,,7 

5 „L: loop: 

ё imull Фесҳ, ерх y *= n 

7 addl Фесх, tesi x += n 

ü decl %есх n-- 

5 testl Жесх,Жесх Test n 

10 setg žal n > Ü 

11 cmpl %ecx,*ebx Compare yin 

12 setl &dàl v«n 

13 andl Фейх, $eax п> 0) & (y < n) 
14 testb $1,*al Test least significant bit 
15 jne .L6 If != 0, goto loop 


ЕЕ, ШАМАЛАРЫН GG. (RB. РАЦ АЛЕ (20 ЯП sm 只 可 能 
取 值 六 或 1， 因此 分 支 条 件 只 需 测 试 它 们 АМО 的 最 低 字 节 。 编 译 器 还 可 以 更 聪明 一 点 ， 用 testb 7H 
今 来 执行 AND EHE, 


练习 题 3.11 答案 
这 个 问题 提供 了 另外 一 种 机 会 来 练习 解读 循环 代码 。C AER Y ЕАК. 
A. 看 看 参数 是 如 何 取出 的 ， 以 及 寄存 器 是 如 何 初 冶 化 的 ， 就 能 确定 寄存 呐 的 使 用 ， 





B. test-expr 出 现在 己 民 码 的 第 5 行 ,汇编 代码 的 第 10 行 ,以 及 第 TEA A& fF i body-statement 
IUE C TUBIS 6-8 17, 汇编 代码 的 第 7~9 行 。 ЖОЛАН while 循环 的 初始 测试 总 是 为 真 的 ， 
因为 1 被 初始 化 为 0， 很 明显 小 于 256. 

C. 加 了 注释 的 代码 是 这 样 的 ; 


1 movl 81%ebp) ,Feax Put à in Фейх 

2 movi lZí(&ebop),t*ebx Put b in ерх 
3 Xor. &ecx,*ecx i= 0 

4 movi %єах,%ейх result = a 
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5 .p2align 4,,7 
a in eax, b in ebx i in Фесх, result in Seedx 
6 „1,5: loop: 
7 addl €eax, £edx result += ú 
8 subl %ерх, %еах а-= b 
9 addl ерх, жесх += Ё 
10 cmpl 5255, %есх Compare і:255 
11 jle .15 If <= goto. Ipop 
12 movl Фейх, #еах Set result as return value 


D. ^£ fr it goto RI. 


int loop while gozotint a, int b) 
{ 
int 1 = 0; 


int result - à; 


1 

2 

3 

à 

5 loop: 
Б result += a; 

7 a -= h; 

B 1 += b; 

9 if íi «- 255] 
iD go-o loop; 
11 return result; 
12 } 


练习 题 3.12 答案 
-种 分 析 汇 编 代码 的 方法 是 试 着 逆转 编译 过 程 ， 生 成 对 C 程序 员 来 涪 看 起 来 比较 “自然 的 ”CC 

fei. ЖІП, ЖП Н goto 语句 ， 因 为 它 在 C 中 很 少 使 用 ,很 有 可能 我 们 也 木 使 用 do while 
语句 。 这 个 练习 迫使 你 将 编译 逆转 成 某 和 框架 ， 它 要 求 思 尊 for 循环 的 番 详 。 它 还 展 居 了 -种 称 为 
代码 移动 (code motion) 的 优化 技术 ， 也 就 是 当 可 以 确定 计算 结果 在 循环 中 不 会 改变 时 ， 将 计算 从 
循环 中 拿 出 来 。 

А. ЖАТУ Я Н result 必须 在 寄存 路 Weax 中 。 初 始 化 时 它 被 置 为 90， 循环 结束 时 禄 在 名 eax 
中 作为 返回 从。 我们 可 以 看 到 i 保存 在 寄存 器 名 edx 中 ， 因 为 这 个 寄存 强 是 作为 遇 个 条 件 测试 的 基 
础 的 。 

B. 第 2~4 行 的 指令 将 %edx 设置 成 mn-1。 

C. 第 $ 行 和 第 IZ 行 的 测试 要 求 1 非 负 。 

D. FE i 被 指令 4s. 

E. 指令 1. БАТ еу ИТЕ Е есл 中 ， 

Е Fi e. 
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1 int loop(int x, At ү, inL n) 

2 1 

3 int resiiíib = 0; 

4 -nt i; 

5 for (1 = n-1; i >= 0; 1 = li-x} Í 
Ü result += v * x; 

1 ! 

Б return result; 

3 ] 


练 避 题 3.13 答案 

这 个 续 习 让 你 能 够 推算 出 开关 语句 的 控制 流 。 回 答 这 些 问题 要 求 你 将 汇编 代码 中 的 康 处 信息 综 
合 起 来 ， 

1. 沪 编 代 苔 的 第 2 行将 x 如 上 2， 以 将 情况 tcases》 内 下 界 设 莹 成 0。 这 就 意味 着 最 小 的 情况 
标号 《case аме) 8-2. 

2， 当 调整 过 的 情况 值 大 于 6 时 , 第 3 行 和 第 4 行 会 导 软 程序 跳 转 到 默认 情况 。 这 就 意味 着 最 大 
情况 标号 为 -2+6=4。 

3. ШЕН, ПАНА ТЖ О-О ЕНІН CLIO 与 第 4 行 的 跳 转 指令 的 日 
贡 一 样 ， 表 明 这 是 默认 情 深 行为 ， 因 止 ， 在 开 鞠 语 凶 体 中 缺 朱 了 情况 标号 -上 

4, 在 味 转 索 中 ， 我 们 看 到 第 5 和 第 6 个 表 项 的 月 的 -- 样 。 这 对 应 于 情况 标号 2 和 3。 

从 土 述 推 更， 我 们 得 到 两 个 结论 : 

A， 开 关 庄 可 体 中 的 情况 标号 值 为 -2、0、1、2、3 和 4， 

B. 日 标 为 .L8 的 情况 标号 为 2 和 3。 


练 可 题 3.14 答案 


x X TL RISE y] a IAS RIDES. 它 看 起 来 非常 奇怪 一 一 call 指令 没有 与 之 匹配 的 ret. 
然后 我 们 惑 意 典 到 七 根本 就 不 是 -个 真正 的 过 程 调用 。 
А. %еах Ж ЕЛ popl 指令 的 地 址 。 


B. 这 不 是 一 个 真正 的 子 过 得 调用 , 因为 控制 是 按照 与 指令 相同 的 顺序 进行 的 ， 而 返回 值 是 从 栈 
中 弹出 的 。 


C. 这 是 IA32 中 将 程序 计数 器 的 值 放 到 整数 寄存 器 中 的 惟一 方法 。 

练习 题 3.15 "EXE 

ЗЕЕВА AERE EH ИШ Ee НИК. Ep SR ейі. wesi 和 名 ebx 是 被 调用 者 保存 的 。 
企 改 变 它们 的 值 之 前 ， 过 程 必须 将 它们 保存 在 栈 中 ， 在 返回 之 前 ， 要 恢复 它们 。 其 他 . -个 寄存 器 是 
调用 者 保存 的 ， 改 变 它 们 不 会 影响 调用 痢 的 行为 。 

练习 题 3,16 符 案 

能 够 推断 闻 数 是 如 和 何 使 用 本 的 ， 是 理解 编译 器 产生 的 代码 的 关键 的 一 部 分 。 正 如 这 个 例子 说 明 
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МН, ЕЛІ Т ЕН ЖТ МЕНІН. 

А. Ў, Февр 的 值 为 0x800040。 第 2 行将 这 个 信 减 了 4, 得 到 0х80003С, ХОЛЛ Г Феһр 
的 新 值 。 

B. 我 们 可 以 看 到 两 个 leal 指令 是 如 何 计 算 要 传 给 scant 的 参数 的 。 因 为 参数 要 以 相 尽 的 顺序 压 
АЕ, ВТ) х РАНЕ еър 偏 移 量 为 -4 的 地 方 ， 而 ¥ 在 储 物 量 为 -8 的 地 方 。 PEE 
们 的 地 址 是 0x800038 ЖІ 0x800034。 

C. 乒 指针 的 初始 值 为 0x800040, 第 2111Ж Г 4. 第 4 行将 它 减 了 24, 而 第 5 行将 它 减 4。 
二 个 入 栈 指 令 将 它 减 了 12， 总 共 减 小 了 科 。 因此， 在 第 10 行 后 ，%esp 等 于 0x800014。 

D. 栈 帧 的 结构 和 内 容 如 下 : 


Пх800080 |4-- &әро 
üx5ià [x 







Оха 00716 
бх800038 


Оха 0034 





Ох800030 
оха Dac 
Оя 00026 
OxBüOo24 


nxaconzo 





Оха 000. C üx80D038 


бх8009218 0х800034 


eno š 0300070 |4--- tesp 


E. 0х800020--0к800033 HF ТАЛЕ. 


练习 题 3.17 答案 
这 个 绑 习 测试 你 对 数据 大 小 和 数组 索引 的 理解 注意， 任何 类 型 的 指针 都 是 4 个 空 节 长 。long 
double 的 GCC 实现 用 了 12 个 字 节 米 存 储 每 个 值 ， 即 司 实 际 格式 只 需要 10 个 学 节 。 


总 大 小 起 始 地 址 TF i 
28 Xa 





练习 题 3.18 ЖЖ 
这 个 练习 是 基 二 整数 数组 E 的 练习 的 一 个 变形 。 理 解 指 针 与 指针 指向 的 对 象 二 间 的 区 划 是 很 重 
要 的 。 因 为 数据 类 型 short 需要 2 个 字 节 ， 所 以 所 有 的 数组 索引 都 将 猜 以 网 子 2。 前 面 我 们 用 的 总 


movl, 现在 用 胸 则 是 movw. 


s[i? 


ald*i+l! 


Тот * Xs +2 


&bhort Міх; +6] 
skort ха 


skort 


M[xz *8i42] 


skort * X. +u- 10 


Жы 3.19 答案 
ММЕН. ЖЕБЕНИ, 3ELLIFITT UU ARSIBTAX. 第 - 步 是 注 


释 汇 编 代 碍 ， 来 确定 如 何 计 算 地 址 引用 ， 


к 0m -і (т ал Ны di nor 


Ші 
mov]l 
leal 
leal 
subi 
addl £ehx,teax 
за11 £$2,*eax 


Bi(Sebpl,tecx 
l2(*ebpl,*eax 


$Secx,tedx 


том] паї 2 (ёеах, &есх, 4), %еах 


addi matl { %ерх, жейх, і}, %еах 


0{, %еах, 4), %ерх 
Di, kecx, E), ейх 
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lea. 2[%ейу+! ,%еах 
movw Б{%ейх,,%ах 
leai {%еам, %есх,2},%вах 


movw Ji*edx,*ecz,8d]),*àx 





lea. -IU9(*edx,£ecx,2]*eaxs 


5*j 

20% 

mat2[(20*j + 4*iy4] 

+ marl [(4*j + 285y4] 


НЕ ТИГЕН, AER mal 的 引用 是 在 字 节 偏 称 4(7i+tj) 的 地 方 ， 而 对 知 隆 mat2 的 引用 是 
EFH ASA. ШИЙ тап 有 7 列 ， 而 mat 有 5 Я], $38] M=5 和 N=7。 


练习 题 3.20 答案 

这 个 练习 要 求 你 研究 并. 响 代码 ， 理 解 是 邵 何 优化 它 的 。 对 提高 程序 性 能 来 说 ， 这 是 一 项 很 重要 
的 技能 。 首 过 调整 你 的 源 代 码 ， 你 可 以 影响 产生 的 机 器 代码 的 效率 。 

Pei C TUER) IA PLAN: 


/* Set ali diagonal elements to val */ 


void fix set diag optí(fix matrix А, int val) 


{ 


int *Aptr = ЬА[0][0 

int cnt 

da 1 
*Aptr - 


Арт -= 


= N-1; 


val: 


(N«-1]:; 


cnt--; 


+ 255; 


210 $3* 


10 ү while {cat >= D); 
11 ] 


通过 下 面 的 注释 可 以 看 出 它 与 汇编 代码 的 关系 ; 


1 movl 12[*ebp),S&edx Get val 

2 movl 8ií$ebpl,eax Get А 

3 movl 515, %есх [= 

4 addl 51020, #еах Apir = &АЈОМО} + 1020/4 
D ‚рда_1йп 4, , 

Б .L50: Ipop: 

7 movl €edx,í(*eax) *Áptr = val 

8 addi 5-68, %вах Apir -= 68/4 

3 decl *ecx Е- 

10 jns .LSC if 1 >= 0 poto loop 


ІКЕЙ НЫН АЕА МН EE kE TES ER n T IF, ЕНЕНЕ E 68 (=17.4)， 因 为 数组 
ЖЖ Ali-1]li- 1181 Ari] 9 М 个 元 素 。 
练习 题 3.21 答案 
这 个 练习 让 你 思考 结构 布局 ， 以 及 用 来 访问 结构 的 域 的 代 公 。 该 结构 声明 是 文中 所 相 例 子 的 ` 
个 亚 形 ， 它 表明 藤 套 的 结构 的 分 配 是 将 内 层 结构 嵌入 到 外 层 结构 之 由 的 ， 
A 结构 的 布局 图 是 这 样 的 ; 
RE 0 4 8 12 


не 


B. CRIT 16 W. 
C 间 平 时 - 样 ， 我 们 从 给 汇编 代码 加 注释 开始 ， 


1 trovl Я (ерр), %еах Get sp 

2 movl ё (гах), едх Get 5р->$.у 

3 movi Фейх, 4(%еах? Сору to sp-»s.x 
4 leat 4(%гах),%ейх Get &(sp-3.x) 
5 ПОУ1 Фейх, (*eax! Сору to 5р->р 
ñ movl %еах,12{%еах) sp->next = p 


出 此 ， 我 们 可 以 产生 如 下 C FCR: 


void sp init(struct prob *sp! 


Sp--59,.Xx = BD--8.y; 


8вр->р = Б{Вр->®,Х); 
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ар-эпехо = Sp; 
} 


练习 题 3.22 答案 
这 是 一 个 很 棘手 的 问题 . 它 糙 对 雯 猜 迹 技术 作为 逆 问 工程 的 一 部 分 的 需求 提升 划 了 个 新 闹 度 。 
它 清 晰 地 表明 ， 联 合 是 一 种 将 多 个 名 宁 (和 类 型 ) 与 单个 存储 衍 置 联系 到 一 起 的 阶 单 方法 。 
点 .联合 的 布局 如 下 面 所 小 。 正 如 这 上 张 专 说 明 的 政 样 ， 这 个 联合 既 可 以 解释 为 “el СНК elp 
和 el,y)， 也 可 以 解释 为 “e2”( 有 域 e2,x ЖІ e2 next). 
ЕЕ 0 4 


B. tH ІЗ D. 
C. Зем d$, ЖИП АЛ SIS GERE. ПАПЕ, Жн ЛЕ, ERUIT 
ЖЕКЕН, RImpEdudUA-eXE—REE. РИШ. X21 BEI DL ЕЛИ Ж el.y， HE 


п] ИВЕ АХ Я U Ж e2.next. (E98 3 dT. 我们 看 到 是 用 间接 存储 器 引用 购 万 式 来 使 用 让 个 值 的 ， 所 
以 只 可 能 是 第 一 种 解释 了 。 


1 movl 8(*ebp),$eax (беінр 

2 movi 4(Феах), Sedx | up-»el.v(no] or ир->#2.пем 

3 movl (Жейх),Фесх up-»e2.next-»el.p or up--e2,.next-»e2.x (no) 
4 movl /$eax),£eax up-»el.p (nol or up->e2.x 

5 movi (Жесх),Фесх *(up--e2.next--el.p) 

6 subi $eax,*ecx *(up-»e2.next--el.p) - up-»e2.x 

7 


movl $ecx,4(tedx) Store in ир->е2,пехі->е1.у 
ШЕ, Йөр im F СЗ; 


void proc (union ele *up) 
[ 


up-»-eZ2,nexL-»el.y = *(iup-»e2.next-»el.p) - up-»e2,.x; 


} 


练习 题 3.22 答案 
村 理解 各 种 数据 结构 中 要 多 少 存 情 ， 了 以 玉 对 理解 编 详 器 为 访问 这 些 结构 产生 的 代码 来 说 ， 理 解 
结构 布局 和 对 齐 是 非常 重要 的 。 这 人 练习 让 你 看 清楚 一 些 示 例 结 构 的 细节 。 


А, struct Pl í int i: char c; char d; int j; }; 
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B. struct P2 { int i; char с; char d; int j: |: 





C, struct P3 { short w;3]; char c[3] ; 





D. struct РА { short w.3]; char *c[3] b 





E.struct Рі { struct Pl a[2]; struct P2 *P ; 





练习 题 3.24 答案 

АТЫМ пт) БЕКУЛЫ, ИШИ, CETUR. ASCI 码 和 字 节 顺序 。 它 说 明了 越界 
存 情 器 引用 的 危险 性 ， 以 及 缓冲 区 汶 出 背后 的 基本 由 想 。 

А. 第 了 行 时 的 栈 . 


i [B] Bh HE 
{ЖТ Феро 4— К %ерр 
ba [4-7 | 


w ПА 


HF besi 
保存 的 %еһх 





Xs. |ui sth ht 
ЖН Зарр *— февр 
һи [4-7 


but[ü-3: 





C. 这 个 程序 试图 返回 到 地 址 0x08048600， 低 位 字 节 被 结尾 的 空 (mull) FART. 
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D. 保存 的 寄存 器 %ebp 的 但 变 成 了 0x31303938. SE getline HEZA EXC {ИЛДӘ 8128 (r 


器 中 。 哥 不 的 其 已 寄存 器 不 受 影响 ， 因 为 它们 保存 在 栈 中 比 buf 更 低 的 地 址 上 。 


E. 对 malloc 的 调用 应 该 以 sulen(but1 FACZA h AER AA АОБ РИЙ дт AIET. 


练习 题 3.25 答案 
这 个 练习 使 你 有 机 会 试 试 3.14.2 节 由 描述 的 递归 过 程 . 
1 шас Ç O e Та 
: load b te 
b +510} 
3 — multp $st (0) 
i сода IT 
а — — | вейй) 
° ap авв Газо) 
6 пес &st (0) 
7 load c %sc(1) 
Sst {0) 
я load b &st(2) 
tst) 
[E C] secto 
9 load а е (3) 
*st (2) 
*$stíil) 
КЕНЕГЕ ] eem 
ію теме hot (2) 
tat (1) 
tatit} 
п aiw tst (1) 
| a Вус *st (0) 
13  multp афс -(a- b.c) | ЖБ (D) 
13  storep x 
练习 题 3.26 答案 


站 向 这 段 代 但 与 编译 器 为 基于 个 油 试 结果 从 两 个 值 中 进行 选择 产生 的 代码 相似 : 


1 
г 








test *eax, teax 


q 


ә яж 2-2 


4 jmp 1,9 

5 Lll: 

; 19: 

$3 SIETHEHELES x ? a : b. 
练习 题 3.27 答案 


出 革 爷 的 关于 弹出 拘 作 烤 的 规则 ， 以 及 参数 的 顺序 等 等 ， 浮 点 代码 非常 准 处 理 . 这 个 练习 使 你 
有 机 会 完整 地 完成 一 些 特殊 情况 ， 


1 fldi b T hp Таз) 


2 fldla s b | в 
| a | sst(0) 

і fm вне | | sett) 
x Gb | èsto 

4 Zych cit) 

*sti 

5 Edivrl с &st (11 
b бак 10) 


fstp x 
这 段 心 码 计 算 的 是 表 这 碟 x-afb-c/b. 


H 318 3.28 EXE 
X 4 £2) ЖШ К АЕР А ESSI IS EROR PIE CREDIS ERI А, 





code/asnvfpfunct2-ans.c 
1 doubio funct2(int a, doub.e x, float b, float 1) 
2 


| 


3 return a, (x+) - 12.11: 


É 


—— code/asm/fpfunct2-ans.c 
练习 题 3.29 答案 

全 第 4 行 利 第 5 412 [I A, КУНЫ: 

| cmpb $1,*ah Testif comparison outcome is < 

练习 题 3.30 答案 


1 int ok,smul(int x, int y, int "desti 
à { 


程序 的 机 器 骸 表 示 


long long prod = [long long) x * v; 


int trunc = (імі) prod; 


*dest = trunco; 


return (trung == prod); 
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ARARE АЕ ГА А EARE BARE RRRA 5 O FERAN F. ПШ 
$5 — ЕНЕ А ЕН А e EAE. DL KER IUE Ж BU ER SA FEB LOK ii 
ARE HRA ЕЗШ ЖШ ЯВ С 68 20 年 前 价值 1000 万 美元 、 有 房间 那么 大 的 超级 计算 机 相形 
Н. ШЕТУ. АЗН ЗНАЧЕ ПОРОЕН В А НИКА ОК, 
ИЯ ЛР BERI] SACS Ж. 

ЯША, ПЕНЕВ AR ELT LS ВЕ, ВИДА К АЕ NJIA 系列 
Е, ЗАРУН АЕ, ПЕН ЗЕ Р £ ЕТІНЕН 
Й зА — ДИЕ 88 X NH 2 ЖИН $ PJ H Ж ВВТ E R ISA Cnstructionset architecture, 
НЭ АЛЕ EJ). ЖЕНЕ ЖЕ”, ӘП Intel TA32 . TBM/ Motorola PowerPC 和 Sun Microsystems 
SPARC, АНЛА ЙО ISA. ЕЕН ie pk fr 种 机 器 上 运行 ， 就 不 能 和 在 另 一 种 机 器 上 运行. 另外 ， 
f] — ^ 30 UTER АМЕ ЖАРАН. mOABET mise] ДЕШ ЕНЕН Ы АКЕЛ ЗЕ Е, {Н 
АСАН ЗЕН ISA RA ИИИ ЛЖИ. ЕЛ А Е C020 1A320. НЕН 38 ЛИН 
多 个 | JW. Bub. ISA (ЕШНИЯЗ ИЛИИ Ал Z ЕЕ ЖШ. ЕЕ 
ЖАЛЫН ДҮН ЕТ S. Pl ЙДЕ АЗУ; (jb SESETE VE e RR Hi FT В 
令 的 处 此 器 。 

本 章 将 简要 介绍 处 理 器 栈 件 的 设计 。 我 们 将 研究 - -个 硬件 系统 执行 某 种 ISA 指令 的 方式 ， 这 会 
使 你 能 更 好 地 型 解 计算 机 是 如 何 上 作 的 ， 以 及 计算 机 制造 商 们 面临 的 技术 挑战 ， 个 很 重要 的 概念 
Pk ep V АЕР ЖЕН c E L ЙЕ Л Ku BEER ISA 隐 省 的 计算 模型 大 相 径 庭 。ISA 模型 看 全 去 应 该 是 顺序 
指令 执行 ， 也 就 是 先 取 出 一 条 指令 ， 等 到 它 执 行 完毕 ， 再 开始 二 一条 。 然 而， 与 一 个 时 刻 只 执行 一 
条 指令 相 比 ， 通 过 问 时 处 王 多 条 指令 的 不 同 部 分 ， 处 理 器 可 以 获得 较 高 的 性 能 ， 为 了 保证 处 理 器 能 
得 到 加 上 顺 绎 执行 相同 前 结果 ， 大 们 采用 了 ” 些 特 萄 的 机 制 。 在 计算 机 科学 中 ， 用 己 妙 的 方法 在 提高 
性 能 有 的 同时 ,多 保持 -个 蝎 简 单 、 更 抽象 模型 的 功能 的 思想 是 从 所 周知 的 。 在 Web 浏览 器 或 像 平衡 
一 义 树 和 哈 希 圾 这 样 的 信息 检索 数据 结构 中 使 用 缓存 ， 就 是 这 样 的 例子 。 

你 很 可 能 永远 部 不 会 自己 设计 处 理 器 。 这 是 专家 们 的 任务 ， 他 有 [. 作 在 全 球 不 天 100 家 的 公司 
Ea SA ATA RICE Jat BESTE EHE? 

”从 智力 方面 来 说 ， 处 理 器 设计 是 非常 有 趣 的 。 学 习 处 理 器 是 怎样 工作 的 本 身 就 是 一 忻 很 有 

古 关 的 笛 情 。 而 翌 外 有 趣 的 事情 是 了 解 作 为 计算 机 科学 家 和 工程 师 日 常生 活 ”部 分 的 个 
系统 的 内 部 1 作 原理 ， 特 别 是 很 多 人 部 还 不 了 和 解 它 。 处 埋 器 设计 和 包括 许多 好 的 .|. 程 实践 原 
BR. РЕЛЕ ENTS. ШЫ ХАТТЫ, 

e 理解 处 理 器 是 如 何 工作 的 能 帮助 理解 整个 计算 机 系统 是 如 何 工作 的 。 在 第 6 章 中 ， 我 们 将 
讲述 仓储 器 (memory) 系统 以 及 咱 来 创建 很 人 的 存储 器 映像 同时 又 有 快速 访问 时 问 的 技术 。 
参考 处 理 器 师 的 处 理 器 一 仓储 将 接口 会 使 那些 讲述 更 完 不 。 

e 有 然 很 多 有 人 设计 处 理 嚣 ， 但 是 许多 人 设计 包含 处 理 回 的 硬件 系统 。 将 处 府 喘 嵌入 到 实际 
系统 路 ， 刀 汽车 种 家 用 电器 ， 已 经 变 得 - 扩 常 普通 了 。 答 入 式 系 统 钓 设计 者 必须 了 解 处 理 器 
ХЕДИ ТЕ, МАЕ ИЕН ЕШ Ж ЕН Ж ЗІ ЕЕЕ РАН ЕЈ. 

€ 你 的 工作 可 能 就 是 处 理 器 设计 - ҚАҒАН ЫН АЯНЫ». {ПЕН SAJAT AO 
队伍 已 经 非 莹 请 大 了 ， 侧 县 还 在 增 大 一 个 主要 的 处 理 器 设计 的 各 个 方向 大 约 涉及 到 800 
PA 
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本 章 中 ， 我 们 首先 要 定义 一 -个 简单 的 指令 集 ， 用 来 作为 我 们 处 理 器 实现 的 运行 和 示例。 因为 受到 
[A32 指令 集 的 忆 发 ， 而 它 义 被 称 为 “X86”"， 所 以 我 们 称 我 们 的 指令 集 为 “Y86” 指 令 集 。17 IA32 
柑 比 ，Y86 指令 集 的 数据 美 型 ， 指 令 和 嬉 进 方式 部 要 少 一些 ， 它 的 字 池 级 编码 也 比较 简单 。 不 过 ， 
BEIRTE TE, 能 让 我 们 写 一 些 简单 的 处 理 整 数 的 程序 。 设 计 一 个 实 理 Y86 的 处 理 器 要求 我 们 面 
ALTES ETRAS ЫИ ж ЕН ШАП п]. 

接 下 来 我 们 会 提供 一 些 数 宇 硬 件 设计 的 背景 。 ВО ОКА ТЕА ВЕЉА, АМЕ 
们 是 如 何 连 接 起 来 和 操作 的 。 这 些 介绍 是 建立 在 第 2 章 对 布尔 代数 和 位 操作 的 讨论 的 基础 上 的 。 我 
们 还 将 介绍 一 种 描述 硬件 系统 入 制 部 分 的 简单 语言 ， BCL (Hardware Control Languapge， 硬 件 控制 语 
言 )。 过 后 ,我们 会 用 它 来 描述 我 们 舶 处 理 器 设计 。 即 使 你 已 经 有 了 一 些 演 辑 设 计 的 背景 知识 ， 也 应 
该 读 访 这 个 部 分 以 了 和 解 我 们 的 特殊 符 写 ， 

作为 设计 处 理 器 的 第 - - 步 ， 我 们 给 出 一 个 基于 皮 序 操作 、 功 能 止 确 但 是 有 点 不 实用 和 的 Y86 处 理 
器 。 这 个 处 理 器 每 个 时 钟 周 期 执行 一 条 完整 的 Y86 指令 。 所 以 它 的 时 钟 必须 足够 慢 ， 以 允许 在 一 个 
周期 内 完成 所 有 的 动作 。 这 样 一 个 处 理 办 是 可 以 实现 的 ， 介 是 它 的 性 能 远 逊 低 于 相 问 硬件 应 该 能 这 
到 的 性 能 。 

以 这 个 肪 序 设计 为 基础 , 我 们 进行 一 些 卜 造 , 创建 “个 流水 线 化 的 处 理 器 Cpipelined processor). 
这 个 处 理 器 将 每 条 指令 的 执行 分 解 成 五 步 ， 每 个 步骤 由 - 个 独立 的 硬件 部 分 或 阶段 (stage) ЖАКЕ, 
指令 步 经 流水 线 的 各 个 阶段 ， 昌 每 个 时 钟 周期 有 一 条 新 指令 进入 流水 线 。 所 以 ， 处 理 器 可 以 同时 执 
行 卫 条 指令 的 不 同 阶段 。 为 了 使 这 个 处 理 器 保留 站 86 ISA КИЕВЕ, ЕЖЕН ЕЕ ЮА 
X (hazard) 条 任 。 上 由 险 就 是 一 条 指令 的 位 置 或 操作 数 依 束 于 其 他 仍 在 流水 线 中 的 指令 。 

我 们 设计 了 一 些 工具 来 研究 和 测试 我 们 的 处 理 器 设计 。 其 中 包括 Y86 的 编 详 器、 在 你 的 机 器 上 
运行 Y86 程序 的 模拟 器 ， 还 有 针对 摧 个 顺序 处 理 器 设计 和 一 个 流水 线 化 处 哩 器 设计 的 模拟 器 。 这 些 
КИ КЇ ЫЗ А HCL 符号 表示 的 文件 中 描述 的 , 通过 编辑 这 坚 文件 和 重新 编 评 模拟 器 ,你 可 
以 改变 和 扩展 模拟 行为 。 我 们 还 提供 许 名 练习 ， 包 括 实 现 新 的 指令 和 修改 机 器 处 理 指 令 的 方式 ， 还 
提供 测试 代 但 以 带 助 你 评价 你 修改 的 正确 性 ， 这 些 练习 将 极 大 地 帮助 你 理解 所 有 这 些 内 容 ， 也 能 使 
你 更 理 解 处 理 器 设计 者 面临 的 许多 不 同 的 设计 选择 ， 
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如 图 4.1 Ps, Y86 程序 中 的 每 条 指令 都 会 读 取 或 修 收 处 理 器 状态 的 某 些 部 分 ， 这 称 为 程序 员 
可 见 状 态 ， 这 时 的 “程序 员 ” 既 挫 用 汇编 代码 写 程 序 的 人 ， 也 包括 产生 机 器 级 代码 的 编 详 器 。 在 我 
们 汐 处 理 器 实现 中 ， 只 要 我 们 能 保证 机 器 级 程序 能 够 访问 程序 员 可 见 状态 ， 就 不 需要 完全 按照 ISA 
障 舍 的 方式 来 表 汪 和 组 织 这 个 处 理 器 状态 。Y86 的 处 理 器 状态 类 似 于 IA32。 有 八 个 程序 寄存 器 ; 
Феах. Фесх. Фейх. %ebx. Pesi, Wedi, Фезр 和 %ehp， 椒 理 器 每 个 程序 寄存 器 存储 一 个 学 。 寄 
ВЕ езр 被 入 栈 、 出 栈 、 凋 用 和 返回 指令 作为 楼 指针 。 而 其 他 寄存 器 没有 十 定 的 含义 或 固定 值 。 有 
三 个 一 位 的 条 件 码 ，2F、SF 和 OF， 它们 保存 着 有 关 最 近 的 算术 或 逻辑 指令 造成 影响 的 信息 ,程序 
计数 器 (PC) 里 存放 着 当前 正在 执行 指令 的 地 址 。 丰 鳍 器 ， 从 概念 上 来 说 就 是 -个 很 大 的 字 节 数 组 ， 
保存 着 程序 和 数据 。Y86 程序 用 虚拟 地 址 来 引用 存储 器 位 置 。 硬 件 和 操作 系统 软件 联合 起 来 将 虚拟 
地 址 翻 详 成 指明 数据 洋 际 存在 存 酝 路 中 哪个 地 方 的 实际 工 物 理 地 址 ,我 们 还 将 在 第 ТО БФ 06 
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细 讨 化 虚拟 存储 器 。 贡 在， 我 们 只 认为 虚拟 存储 器 提供 给 Y86 程序 一 个 统一 的 字条 数组 殴 像 ， 


Ter áp e FE RE SE 
ЖЕН 


РС 
41 Y86 程序 员 可 见 状态 
[]IA32 -Е, Yes 的 程序 可 以 访问 和 修 己 得 序 寄 让 器 、 条 件 码 、 程 序 计 孝明 (PC) ВЕ. 


图 4.2 给 出 了 Y86 ISA 中 各 个 种 令 的 简单 撞 述 。 这 个 指令 集 就 是 我 们 处 理 跨 实现 的 日 标 。Y86 
指令 集 基 本 上 是 IA32 指令 集 的 -个 了 集 。 空 只 包括 四 字 节 更 数 操作 ， 寻 址 方式 比较 少 ， 操 作 也 较 
少 。 央 为 我 们 只 有 有 四 字 全 数据 ， 所 以 称 之 为 “ 字 【werd)”。 dx lm, Zo Re НІНЕ. 
A RE AO. T ESO IA32 程序 的 GAS 表示 非常 类 似 。 


Fi й 1 2 3 4 5 
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=n. m 
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图 42 Y86 指令 集 
指令 编 碍 从 1E due PUE RAS. :条 指令 含 有 一 个 单字 节 的 指令 指示 符 ， 可 能 售 有 个 单字 节 的 寄存 器 指示 符 ， 还 


可 能 党 有 个 国学 节 的 常数 字 。 字 段 如 НЕДЕ MN ERR COPD. ЕЖЕН Охх). КЖ Н КУЛНЫ 
表示 。 
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Fuse 指令 的 更 多 是 节 ， 
е JA32 的 mov 指令 分 成 了 四 个 不 同 的 指令 ， ішпеуі. rrmovl, mrmovl 和 rmmov， 人 分 别 显 式 
地 指明 源 和 日 的 的 烙 上 成 。 源 可 以 是 立即 数 (1)、 寄 存 器 (r) ИЕН Сп» ЕТІ 
МЕНЕН Т ШЕШЕН. НЕЛГЕ ay СО 战 存储 器 tm)。 指 令 名 宁 的 第 一 个 字 
车 指 明了 日 的 的 类 型 .在 决定 如 何 实 现 它 科 时 ， 显 式 地 指明 数据 传送 的 这 四 种 类 型 挟 很 有 
帮助 的 。 
项 个 存储 器 传送 指令 中 的 存储 器 引用 方式 是 简单 的 基 址 加 位 移 形式 。 在 地 运 计 算 中 ， 
我 们 不 支持 第 一 变 扯 寄存 器 《second index register) 和 仔 何 寄存 器 值 的 伸缩 (scaling). 
F A32 -, HR PS YE “ТОРМАНЕН ЕНІН — q (RE ЕНЕ АЕ. op. W 
们 也 不 允许 将 立即 数 忧 送 到 仓储 器 。 
. ДЛЕ, ЖЕЕ 4.2 中 的 OPI。 它 们 是 aadl、subl、andl хот, АО 
ése SU WEG RE, ІШ IA32 还 元 这 对 人 在 仿 器 数据 进行 这 芋 操 作 。 VUE p RW PET 
МШ ZF. SFEALOF CX, HE SURE HDD. 
e 七 个 跳 转 指令 《图 42 中 的 jxx) R mp. jl, jl. je. jne, jge Fu jg. 根据 分 支 指令 的 类 型 
和 过 件 代 色 的 设置 来 选择 分 文 ， 分 支 条 件 和 [A32 的 一 样 《 见 图 3.11). 
е сай ЕДЫМ АҒАҢ, ЖЕЕП Н НЕН. rec 描 令 从 这 样 的 过 程 调 用 中 返 河 ， 
“ push! 和 рор SARAHA. ТЕ IA32 +F. 
= hal 指令 停止 指令 的 执行 。IA32 中 有 一 个 与 之 相当 的 指令 ， 电 hit. 1432 的 应 用 程序 不 多 
许 使 用 这 条 指令 ， 因 为 它 会 导致 整个 系统 和 停止。 我 们 在 Y86 BFF P FH hatt 指令 来 停 上 模拟 
he 
图 4.2 ЖАН ri HE Ua. ИТЕ ЕЛЕЕ, eine h 1 一 6 个 字 节 不 等 ,每 
条 指令 曲 第 一 个 字 节 表明 指令 的 类 型 。 这 个 字 节 分 为 两 个 部 分 ， 每 部 分 四 位 ， 高 四 总 是 代码 《code ) 
War. TUEA ВЕ “function》 部 分 。 如 图 4.2 Ғы, RUE 0-B (RRR ef Rd TF 
一 组 相关 指令 共用 -个 代码 时 才 有 用 。 图 4.3 给 出 了 加 数据 作 和 分 支 指令 的 具体 编码 。 


хі? 
“Ге 
subl nB le jge ! 7 | 5 
Au 
xorl BB ie M 


ің 4,3 Y86 指令 集 的 功能 码 
这 些 代码 指明 是 其 个 整数 操作 还 是 分 支 条 件 ， 这 些 指令 是 图 .2 中 所 示 的 OPI јхх, 


如 图 4.4 所 示 ， 八 个 程序 寄存 器 中 每 个 部 有 相应 的 0 一 7 的 寄存 器 标识 替 (register ID)。Y86 中 
RJ Wr £ sa > pR А32 中 的 相同 。 程 序 寄 在 器 被 存在 CPU 中 的 -个 寄存 器 文件 中 ， 这 个 寄存 器 文件 
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Же УЛЫ. БАЯНҒА ID 作为 地 址 的 随机 访问 存储 器 ,LD (B 8 用 于 指令 编 乌 中 ， 在 我 们 的 硬件 
设计 中 ， 当 需要 指明 不 应 访问 任何 寄存 器 时 ， 我 们 就 用 这 个 值 来 表 汶 :。 





Ü 
1 
2 
E 
4 
5 
Б 
8 


图 4.4 YS6 程序 寄存 器 标识 符 
用 个 程序 琳 存 器 中 每 个 都 有 ”个 相对 应 的 标识 符 《ID)，0- 3。 如 果 指 令 中 某 个 寄存 器 字段 的 情 为 5D 8， 就 老 明 此 处 漫 有 寄 声 
ЖЕНЕ. 


有 的 指令 只 有 AFËR. MAURER ЕЕЕ Е-Е. WX. BETILER FI ST 
зан 0 (register specifier byte), {ШЕ -个 或 网 个 省 存 器 。 在 图 4.2 中 ， 这 些 寄存 器 字段 称 
为 址 和 二。 从 指令 的 汇编 代码 老少 中 可 以 看 到 ， 根 据 指 令 灿 型， 指令 可 以 指定 用 本 数据 源 和 日 的 
的 奇 丰 如 ， 或 是 用 于 地 址 计算 的 基 址 寄存 器 。 没 有 寄存 器 操作 数 的 指令 ,例如 分 支 指令 和 调用 指令 ， 
MEA YTAN H. MELEE- TATAR AES (irmovl. pushi 和 рор!) 将 男 一 个 
寄存 器 指示 符 设 为 8。 这 种 约定 在 我 们 的 处 理 器 实现 中 非常 有 用 ，。 

有 些 指 令 常 要 :个 附 如 的 四 字 节 常数 字 (constant word)。 这 个 字 能 作为 irmevl 的 立即 数 数据 ， 
作为 rmmovl 和 mrmovl 的 地 址 指示 符 的 位 移 量 ， 以 及 分 支 指 令 和 调用 指令 的 HH 的 地 址 。 注 意 ， 分 支 
指令 利 调用 指令 的 也 的 着 一 个 绝对 地 址 ， 而 不 像 ТАЗ2 中 那样 使 用 PC 〈 程 序 计数 嚣 ) HORT LB JI 
式 。 处 理 器 使 用 PC 相关 的 寻 址 方式 ， 分 支 指令 的 编码 会 更 简洁 ， 同 时 这 样 也 能 允许 代码 从 在 储 器 
АЧ 一 宰 分 撞 由 到 另 一 部 分 而 不 需要 更 新 所 有 的 分 支 日 标 地 址 。 因 为 我 们 更 关心 描述 的 简单 性 ， 所 以 
ЖЇН: 了 绝对 才 址 万 式 。 同 IA32 --- 样 ， 所 有 整数 采用 小 端 法 (littie-endian) 编码 。 当 指令 按 招 反 汇 
网 格式 书写 时 ， 这 些 字 节 就 以 相反 的 顺序 出 现 ， 

例如 ， 让 我 们 用 十 六 进 制 来 表示 指令 rnmovl $esE，0x12345{%edx) 的 字 节 编码 。 从 图 
4.2 我 们 可 以 看 到 ，rmmov] 的 第 - МЕЛІ 40. ЖАНР Феөр 应 该 编码 放 在 ТА ТР. ПЕН 
АҒ ебх 应该 编码 放 在 ТВ 字段 中 。 根 据 图 4.4 中 的 寄存 器 编号 ， 我 们 得 到 寄存 器 指示 符 字 节 
42。 甩 后 ， 亿 移 电 编码 放 在 四 字 节 的 常数 字 中 ， 首 先 在 0512345 的 前 面 填充 |. 0 变 成 4 个 字 和 他 ， 
变 成 子 节 应 列 00012345. RRT 节 反 序 就 是 45 23 01 00。 将 它们 都 连接 起 来 就 得 到 指令 的 纺 
f£ 404245230100. 

指令 集 的 一 个 重要 性 质 就 是 字 节 编码 必须 有 惟一 的 解释 。 任 意 一 六 字 闻 译 列 要 么 是 MEC 
的 指令 序列 的 编码 ， 蓝 么 就 不 是 :个 合法 的 字 和 邓 序 列 。Y86 就 具有 这 个 性 质 ， 羽 为 每 条 指令 的 第 
-个 字 节 有 惟 -的 代 耕 和 功能 组 侣 ， 给 定 这 个 字 节 ， 我 们 就 可 以 决定 所 有 其 他 附加 字 V ES ЕЛА! 
含义 。 这 个 性 质保 诉 了 处 百 器 可 以 无 二 义 性 地 执行 日 标 代 个 程序 。 只 要 从 序列 的 第 一 个 字 节 开始 
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SERE, ШКЕ АДЛЕР Ер ДЫ Еа, RU eH S BARER EN. БЖ. m 
Та Ае ЕРТЕ RET 
UL REPRE I, НА ЕН ЧР НИП ЕНІН БЕ А РЕ АЕ —%® T дй. ЗЕ 
了 问题 ， 





B - Ё m. т Ж. * T =- pE E! Ld 
ж 


аж Ұмалтыа т: m м^ атъ ae Wi 
"Атан тыы И $82. * pos 0x100" A6— ITA EHE R ü KU Hide ай 
Й Ox 100. 


pos 0х100 # Start pencrating code at address (x 100 
irmovl 515, %ebx 
rrmovl  &ebx,&ecx 
Leop: 
Emnovl &ecx,-J3(Webx) 
addl tabu, tecr 
jmp loop 





UIN 42 CES "mr кз T : T prre 1: E ДЕ | 454 Г 
ахтан УЖЕ КАЕ Y86 8A M, 如果 序列 中 有 不 合法 的 字 节 ， тҮ 
МВА E ІНІН, ЯАНАА ЕТЕН, YXESTTAH. 
А. Qx1DD:30B3FeFFFFFF40630008000010 
Ox20D:ral688008020000103DB30a00000090 
. Üx3DD:50546?006000000£F0b018 
0х400:6113730004000010 
0х50016362а080 





E с r3 tm 





224 
lE. жінелінанныЖ, 

RISC WR E dE E 加 世纪 80 ЖЕДИ Ж EES Adi Men — ДА А. IBM 的 
—HB HE dE E Ф 9 IBM 研究 员 Joha Cocke fd X Wis, UL eim Ж LA 4-3 
ВАЛЯ НИК. EHE. W$ bob ii Ak takish pikha ig a a. £ Riki 
уыл. т к БАЛ ЕЗ ЖЕ ТЕТЕ ЕТ ЧИШ 
Жк жж. IBM É Ж B REL 4 JE THE Л. PF K H T Power 和 PowerPC 
ISA. 

hu ЗЕНА f£] H0 David Patterson 363838 48 * ЖБ John Hennessy 进一步 发 展 了 RISC 的 概 
4. Patterson AF Sed d p S e E A RSC ж W W apaku СІС, Beo od ede 
-H HEGgel THE HER ET, 

比较 CISC e R dot) RISC МАА, ANARTEAN Ai, 


tatas. ӘГІГІІГ тоо | во. ае то 
ЕЗГІ 

didit HILEE, BENER 
ВИНЕН аа. A XA 
| £4 E -EABHILEENARBAR AMENS 
58 HERBA 


Ika Ti ЕЙІН. ІА RAR Tu i- 15 
Май | 

ПЕЙ ТВИТ А Р. KlAY P. PAESE 

ШЕЯ Ги ЕШШ, Q ip uba dk. 
| Bet велин тый 

ust Ape d EMERGERE ЖЫЛ K 


КЕЛЛЛІМШІДІЕ ҒӘ же ны С RELIRE 
Ейіні. PARABA- Ж Ке k ЕЛЕЕ 
ЛЕЛЕ, ñ Yi Ж hir REIR à d 
BÁXUyk AaATRAKUAUARE 
ачыккан кен. LARAAUBI. 


Bñ A load fe were Hes load ЖЕНЕН) АЕ. sore 
AAWABNMARE GG ibd kaulian ік & tle 


[эненин S AOT RA, пл йй 
| ТФА Аа г Rr oed 


ана. Фани z. ЖЕТСЕН 
кл HOS eH en 

| SERATA, HALTLECO CH кен 
нн 


ТРТ ATLA, Же ис кай 


НАН Н. SHERRET- iqi T ok B 


TAAR денш анай | 


ағана, ык, Apka. pansi us. | 
кенені Нн ” 
ЖЛЕРЕНЦЯНШ, AENEA ABC q БЫН: mi, 
ы. REX kti+akaqñim ити? 
(АЗЫ) £48 





Y86 fi 4-808. CISC Ho R6. e f RISC A4 R4 RH. de CISC —H, Ed RH. 
ЖКА, ПАНЕ ФАНИИ, de 5С. ERA loud/store Jk ñ tk fedi B Mo 
( regular encoding ), Y86 4#4 JE9T Җ R Ж ЖОЕ) CISC MAR (ТАЗ? ), дая 4E RISC 06 8 


"ЖТ +. 


— Oo" ms 


5i. RISC 与 С5С2% 

T9 484-20 482 доқ ip Y ink É W 30388 p 32. T RISC 84 fe CISC ылы» 
ТЯ АА, RISC HEHE EAER ЖЫН АТ, diikat А, ЖИЫР 
Be dU HULA AER ЕШ. e b ERU A мН ЯН), 6 СӘС 633 K RUE —4- 
BEHEREAN СТУС HA. n BIG EB EE OE CUR RE. 

K $ kaytaj tuhi T RISC FE k, 8 Sun Microsystems (SPARC). ІВМ 和 Motorola 
| PowerPC }, 以 及 Digital Equipment Corporation ( Alpha |; 

& M tk Қан, Sibi. M 3 SSESIAET, ажын RISC 还 是 音 
Ен CISC ЖЛ. del o 8 ЖОЖ. IUE bh. RISCAR AR EIE HEP. ZA T š EE BAS, 5 
W$ iki ti ЖИЫР. $8 RISC HUBER GPL eH JB tad 
НАҚ” НЕНТ Т, EHE ULT REALE MURAL IB Wig T. 
М ҖИЛ] Ek d P n M E ЕНУ, EE XL TEE КЕНЕ ЕТ. CENDA 
Edda. Tit. +5 RISC ibd t eO POE ET HE n d GA Id E Eh 
hri, 

比较 新 的 CISC E 4e 4018 T НАКА, aem A np 57 Фи. 它们 读 取 
CISC für, Жалын d bt Ён. 4 ЕЗСПИНЖИНАН, кк, — fX SERPAH 
И ФЕ IHE: ДЕН ДАДА, — ЬЕ. X 1E 3 
HEARR. d е THEE HUIUS, ЖИ Г АИЖАН Ж. 

ТЖЕ Ж, тю Ж#&ЖЖ ЕН RATED TAERA. Ei 
A кн Ж, Intel AA ТАЗ ФА 4p Rd MT—RLEDR ER. 5T REX 
术 的 进步 , Intel 和 其 他 ТАЗ AERE Bol cb A d t R Ж. ВоВе ЗИ К а Ф, ЗВ RISC 
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ЇН 45%1Ш Filis C А LA32 Ra Yaa T CES 
int Sum(int "Start, int Count] 
| 

int sum = D; 

while (Count!) í 


Bum += “БІЗГЕ: 
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1432 代码 
int Sum(int *Start, int Count) 

1 Sum: 
2 pushl %ebp 
3 movl %евр,%еһр 
d movl #{%ерр},%есх есу = Start 
^ movl 12(Жерр),%ейх edt = Count 
6 xorl Феах,%вах sum =0 

j testli tedx,&edx 
8 je .L34 
9 .L35: 
10 addl {%есх},%геах add *Start to sum 
11 addl 54,%есх Start+ + 

2 decl Фейх Count-- 
13 jnz .L35 Stop when 0 
14 1134; 


15 movl %гбр,%езр 
15 popl $ebp 


17 ret 
Y86 代码 

int Sumi int *Start, int Count) 
1 Sum: 
2 pushl $ebp 
3 rrmovl *esp,%ebp 
4 mrmovl 8{%еБр},%есх ест = Str 
5 mrmovl l2(&ebp),$edx edx = Count 
& xorl £eax,£eax sum = 0 
7 andl £&edx,&ecx 
8 je End 
9 бор; 
10 mrmovl (%ecx),%esi get *Start 
l. addl £&esi,€tezx add to sum 
12 irmovl S4.€ebx 
13 addl $ebx.$tecx Start+ + 
14 irmovl $-1,*$ebx 
15 addl ерх, %ейх Cuount-- 
15 jne Loop Stop when Ü 
17 End: 


18 rrmnovl $ebp,$esp 
19 popl %ерр 
20 ret 


4.5 Y86 汇编 程序 与 内 32 汇编 程序 比较 


Sum i B ЖЖЖИ. Y86 代码 与 TA32 FOR THEE ERIT T, En REESE RESORT :条 IA32 指令 所 完成 
的 功能 。 
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XXE 1А32 代码 是 总 编译 器 GCC 产生 的 。Y86 代码 实质 上 是 一 样 的 , 除了 Y86 有 时 需要 两 条 指 
令 来 完成 1A32 - -条 指令 就 能 完成 的 事情 。 如 果 我 们 用 数组 索引 来 写 这 个 程序 ， 要 转换 成 Y86 代码 
WEEE Г, BD Y86 WB IBS (scaled) ӘЛІНЕ. 

图 4.6 给 出 了 -个 用 Y85 汇编 代码 编写 的 一 个 完整 的 程序 文件 的 例 了 。 这 个 程序 既 包 括 数据 ， 
也 包括 指令 。 命 令 directive》 指 明 应 该 将 代码 或 数据 放 在 什么 位 置 ， 以 及 如 何 对 齐 align》。 这 个 
程序 详细 说 明了 栈 的 放置 、 数 据 初始 化 、 程 序 初始 化 和 程序 结束 等 问题 ， 


一 tT" TT cvodefarch/y86-code/asum. ys 
1 f Execution begins at address 0 
2 .pos D 
3 init: irmov. Stack, %евр # Set up Stack pointer 
4 irmovl Stack, %ebp # Set up base pointer 
5 jmp Main # Execute main program 
6 
7 # Array of 4 elements 
B .align 4 
9 array: .long dxd 
10 .long Охей 
11 .long 0хр00 
12 .long Oxao000 
l3 
14 Main: irmovl $4,$eax 
15 pushl Феах # Push 4 
16 irmovl аггау, %ейх 
17 pushl %ейх # Push array 
18 Call Sum # Sum array, 4) 
19 halt 
20 
21 # int Sum(int *Start, ini Count) 
22 Бит: pushl $ebp 
23 rrmovl Фер, $ebp 
24 mrmovl 8 (%ерр\,%есх  fÉecx- Start 
25 mnrmovl 12(%ерр),Фейх #edk = Count 
26 irmovl $0, €eax # sum = 0) 
Aj andl *edx,S£&edx 
28 je Eng 
29 Тоор: mrmovl {%есх!,%е51 # get *Start 
10 addl %esi,%eax # add to sum 
31 irmovl $4,$ebx # 
37 addı Жерх,Фесх # Start 
33 irmovl 9-1, %ерх # 
34 айат Ферх,%ейх # Count-- 
35 ine Loop # Stop when Ü 


36 End: popl ebp 
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37 ret 
i8 pos óoxlo0 
39 Stack: # The stack goes here 


—— — — —— codefarch/y86-code/asum. ys 


图 4.6 用 Y86 汇编 代码 写 的 一 个 例子 程序 
ИІНІ Sum ARKH 4 лж й. 


在 这 个 程序 中 ， 以 “.” 开 涉 的 训 是 汇编 器 命令 assembler directives). dl] rr EH КЕНІН ЖЕЛІ, 
ЊЕ, Dg pr ERA LA THER. 命令 .pos 0 (第 2 行 ) 告诉 沪 织 器 应 该 从 此 址 0 处 开始 产 
生 民 码 。 这 个 地 趟 是 所 有 Y86 程序 的 起 点 。 接 下 来 的 两 条 指令 (第 3 行 和 第 4 和 全》 韦 始 化 栈 指针 可 
ЕН. ПАНЕЛІ ОЖ 39 r) 声明 了 标号 Stack, ЖАН Apos 命令 来 指明 了 地 
At 0xi009。 央 此 我 们 的 栈 会 从 这 个 她 址 开始 ， 问 下 增长。 

程序 的 第 8 一 12 行 声明 了 一 个 四 个 字 的 数组 , 值 分 别 为 Oxd、 0xc0、 0xb00 和 0xa000。 标号 array 
过 明说 这 个 数组 的 起 始 ， ЛАРДА ЯЬ TE ОҢ апап 便 令 指定 )。 第 147-19 ІЗІН Т “main” 
过程， 在 过 程 中 对 有 陡 个 四 个 池 的 数组 调用 六 Sum 函数 ， 然 后 个 小。 

ЛАЙ FS НН, A Y86 GATERA ЗСЖ KRE A TE Bi aANT 
系统 来 完成 的 任务 。 幸 好 我 们 只 几 Y86 来 写 一 些小 的 程序 ， 对 此 一 些 简单 的 机 制 就 是 够 了。 

图 4,7 是 一 个 我 们 称 为 YAS 的 汇编 器 对 图 4.6 中 代码 进行 汇编 多 结 案 。 为 了 醒 于 理解 ， 放 . 编 器 
的 输出 结果 是 ASCII 码 格式 的 ,汇编 文件 中 ， 在 有 指令 或 数据 的 行 上 ， 日 标 代 码 和 包含 一 个 地 址 ， 后 
面 跟着 1~6 个 字 节 的 值 ， 

code/arch/y86-code/usum.yo 
# Execution begins at address 0 


0х000: ров Ü 

Охооо: 308609022000 init: iLrmovl Stack, Февр # Set up Stack pointer 
üxD006: 308700010000 irmovl|l Stack, tebp # Set up base pointer 
0х00с: 7024000600 jmp Mair # Execute main program 


Ж Array of 4 elements 


0х014: align à 
Пх01Ё; с0002000 long Охсб 
1х01с: 000Ь0000 .long 0хр00 


0x020: 004020009 


| 
| 
| 
| 
| 
| 
| 
| 
0x014: 04000000 | array: .lonq üxd 
| 
| 
| ‚1цопд Oxa0230 
| 
| 
| 
| 


Dx024: 308024900600 Man: irmovl 54,%еау 

0x02a: ай08 oushi %еах # Push 4 
Üxü2c: 308214000000 irmovl array,tedx 

0х032: ай28 sushi tedx # Push array 
xü324: ВОЗд00ОООО call Sum 8 Sum(arras, 4) 
0x039: 19 halt 


# int Sum(int *Start, int Count) 
Sum: pushl *ebp 
rrmoyl $esp,£ebpo 


Dx03a: аб58 
0х03с: 2045 
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Өхі3е: 501508000000 | mrmovl 8{%ерр),%есх # ecx = Ма! 
0х044: 502506000000 | mrmovl 12{%ерр) ,sed Ж edk = Count 
0х04а: 3080000060000 | irmovl 50, гах # sum = Ü 
Пх050: 6222 | andl *edx,€edx 

0x052: 7374000000 | je End 

0x057: 506100000000 | Loop: mrmovl (€$ecxl,esi fpe! Жа 
Üxüb5d: 606D | адд] ѕезі, ћеах # add to зит 
0х05Е: 308304000000 | irmovl 54, %еох # 

0x055: 5031 | addl $ebx,*ecx # Start++ 
ÜOxz057: 3083ffIfrfriffÍ | irmovl $-1,%ebx # 

0х054: 6032 | ай41 tebx, tedx # Соипі-- 
0х05Ғ: 7457000000 | jne Loop # Stop when Ü 
Ox074; b058 | End: popl %ерр 

Üxü0/5: 90 | rer 

0х158: | .pos 0x100 

0x130: | tacx:  # The stack goes here 


code/arch/y86-code/asum. yn 


647 YAS 汇编 器 的 输出 
每 一 行 包含 一 个 十 六 进 制 的 地 址 ， 以 及 字 季 教 在 1—6 之 间 的 日 标 代 但 ， 


我 们 实现 了 一 个 指令 集 模拟 器 ， 称 为 YIS. НИ ЕТТ ВЫП ГН НК, РОК 
FEET HH 


Stonoped in 46 steps at PC = Oxia., Exception 'HiT', СС 7-1 S=) б=й 
Changes to registers: 


Ұсах: 0хХ00000000 Ох0000ареа 
Фесх: 0х0о000000 000000024 
жерк: 0х00000000 Oxfttfittft 
евр; 0х00000000 0070000 ЕВ 
tebp: Пх00000000 0х09000100 
tesi: 0х00000000 0х0000а000 
Changes to memory: 

Ох0010; 0х00000000 0х00000100 
0х99214: 0х00000000 0х092000039 
Пх00Ё8: 0х00000000 9х090095014 
Ож00Ес: Пх00000000 0х00000004 


Ый АГЕН ЕЖЕ ЕТЕНЕ ЕЕЕ. INA ЕНА Gc HUE 
们 都 起 0), МЕКЕН. АЖ ПН ДП n ELS fü. WAR еах НО Oxabcd, WATA 


数 Sum 的 四 元 素数 组 的 和 。 另 外 ， 我 们 过 能 看 到 栈 从 地 址 Ox 100 Tg, НЕМЕ, REHEAT 
存储 器 地 址 OxfO--Oxfc 都 发 生 了 变化 。 


ХА. 


根据 下 面 的 C 代码， 用 Y86 代码 来 实现 一 外 递归 求 和 函数 rSum: 


3 


int rSum(int *Start, int Count! 


{ 


230 # i$ 





if [Count <= 0] 
return 0; 
return "Start + rSumiStartesl, Count-1]; 
f 
-š 1А32 3,2 ЕЕ ЕК СК, Hs Bae akii K Үз6 dd. T Rd 
338. 


5 5] B 44 

push] fit 4- piskita 4, JE IL — F$ EB A SE p. ЖІКІТ pushl Февр 指令 时 ， 处 
mEd;5b£zcrd4. BARAH ER AA- bk. HEC: DEA kep 
(EA; DEAT 4 Фе 的 慎 ， 

IL d dv IAT АЕ Е E — AME p ЖЮ Ж Аның, AT EC SERIE Intel X T & Be 
Wk he MYS, ЕМ ФЕД ДЕННИМ Е ЬЕ ӨТЕ. Chi L Til T XT 
+ К Б, FLA а Е rk а EID h Е Ek. Ej 115 ST ibm, 
АСФ А УЧЕС ВАА B HE EUER ССС 的 asm Wik. T EA AUI e T h 
KALI. кей ат АН, Тейеитаттыгақы, HUE BEES. 

int pushtest [| 

[ 

int rval: 

/* Insert the following assembly cade: 
mov] &esp,.teax % Save stack pointer 
pushl Wasp i Push stack pointer 
popl &edx k Pop it back 
subl *edx,9"eax k Ú or 4 

movil tegas, rval = ЕН, Ав return value 


asn['movl **esp,**&eax:pushl $*&espi;popl i*edx; 
БІРІ *todx,t*tecax)novl *«1Yeax,*]" 
| "zr" {грма 
I /* Ho Input */ 
г "Фейх", "*eax"]; 
return tval; 
| 


&A E Ж ШР. АПАН ЖЖ pashiest 3 818 4 0, 这 表示 在 LA32 中 pushl esp 指 他 的 行为 
Eta ep 


ЕЗ 45 

对 popl евр JB 4-45 ЖАНА, Тыйтер K ALARME EE HE. ети И оТ а 
Баяны. nus 44 №, АПИА А ТАЗ AELE AERE ME 
我 们 的 vas dca dp m paa Ж. 

int poptest[int tval) 

| 
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int rval: 
/* insert the following assembly code: 
pushl tval # Save tval on stack 


movi S&esp,t*edx # Save stack pointer 
popl $esp # Pop to stack pointer. 
movl *esp,rval # Set popped value as return value 
movl €edx,$esp $ Restore original stack pointer 
*/ 
asmi("pushl %1; movl %%еѕр, %%еах; popl %%евр; 
movl %%еср,%0; movl #%ейх,%%езр'" 


: "шг" Ilrvall 
: "yM [tval] 
4 C€*edx"); 


return rval; 


) 


我 们 发 现 通 数 总 是 返 加 tyal， 也 就 是 传 进 去 必 为 参数 的 妹 个 值 。 这 表示 在 IA32 中 рор! %esp 指 
令 的 行为 是 记 样 的 ?还 有 慎 么 其 他 Y86 指令 也 应 该 有 相同 的 行为 吗 ? 
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在 硬件 没 计 中 ， 电 子 忆 路 被 用 来 计算 位 的 销 数 “functions on bits), BLA 0 BTE fa s ú ss РЕ 
柄 位 。 大 凶 数 现代 电路 技术 部 是 用 信号 线 上 的 高 电压 或 低 电压 来 表示 不同 的 位 值 。 通 常 的 技术 中 ， 
逻辑 1 是 用 1.0 伏特 左 丰 的 高 电压 表示 的 ， 击 逻辑 0 是 用 0.0 伏特 左右 的 低 电 时 表示 的 。 要 实现 一 
个 数字 系统 党 要 三 个 主要 的 组 成 部 分 ， 计算 位 的 函数 的 组 合 屠 辑 、 在 储 位 的 存储 器 元 素 ， 以 及 控制 
存 情 器 元 素 更 新 的 时 钟 信号 。 

本 世 中， 我 们 简要 描述 这 些 不 同 的 组 成 部 分 。 我 们 还 将 介绍 HCL (hardware control language. 
体 件 控制 语言 )， 我 们 用 这 种 诺言 来 描述 不 同 处理 器 设计 的 控制 塑 辑 。 在 此 我 们 只 是 简略 邮 描 述 
НСІ, HCL 完整 的 参考 请 见 附录 А. 

Ж: 现代 逻辑 设计 

硬性 设计 者 兽 经 梢 内 示意 性 的 逐 辑 电路 图 来 进行 电路 设 计 EFEMERE, ERES X 
机 图 形 终端 )。 ЖЖ, ИНЕ HDL 来 表达 的 。HDL 是 一 种 文本 表示 ， 重 上 去 和 编程 语言 
美 似 ， 但 是 它 是 用 来 描述 硬件 结构 而 不 是 程序 行为 的 。 最 常用 的 语言 是 Verilog, 它 的 语法 类 似 于 CC， 
号 一 种 是 VYHDL， 它 的 语法 类 似 于 编程 语言 Ada。 达 些 语 言 本 来 都 是 用 来 表示 救 字 电 路 的 模拟 模型 
у. 在 20 世纪 80 年 代 中 期 ， 研究 者 开发 出 了 还 部 合成 ( Jogic synthesis) 程序 ， 它 可 以 根据 HDL 
的 医 述 生成 有 效 的 电路 设计 。 现 在 出 现 了 许多 次 用 的 会 成 程序 ， 它 们 已 经 成 为 产生 数字 电路 的 主要 
技术 。 从 手工 设计 电路 到 合成 生成 的 转变 就 好 伟 从 写 江 编 程序 到 写 商 级 语言 程序 ， 再 璀 编译 器 来 产 
生机 器 代码 的 转变 一 样 


4.2.1 EW] 
远 辑 门 是 数字 电路 的 基本 计算 元 素 ， 它 们 产生 的 输出 ， 等 于 它们 输入 位 值 的 基 个 布尔 函数 ， 图 
4.8 给 出 的 是 布尔 消 数 AND、OR 和 NOT 的 标准 符号 ， 布 尔 操作 的 逻辑 门 下面 是 对 应 的 HCL 表达 
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A. ТЕШ ЖАГАН. REUT C hi miqie fik cx 21910: AND 用 区 下 表示 ，OR 
"Eas, ІШ NOT Hiro. ПЕН Соз на EA. HTC REESE AGENCE FH o HT BH, 


ПАТЕ, 
Апа Or Мо! 
E B — | 
* j ш ж P». pan 


W:l= a ea D йн=а| b Wi = :а 


图 4.8 FANAN 
КҮПІ Toc nm xai. 


ШІ a ШЕШІМ (ace), —H — [1B eer. eid Ep, i t Pe HL НЕІЗГІ. 


42.2 БЕ HCL pig Xi st 
ЖИН E THEME MET TM. RREA H Ceomputational block), ЕНЕ dnx. dn 
条 组 成 这 个 网 有 两 条 限定 : 
в 两 个 或 雪 个 还 辑 门 的 输出 征明 接 在 一 起 ， 理 则 它们 可 能 和 会 使 线 上 的 信和 屿 矛盾 ， 导 致 一 个 不 
eid fry ela Hei rd P x 
* EP SEE LIES. HAAA PRETA ИЧ HARE THER. ЕН 
[ИЙ ЕЕ ЕЧ РЕН И E EHE X. 
图 4.9 Ë TRES SR W tal АНШИ T. CHE TSA a 和 bb， 有 惟一 的 输出 
ор За Rb REICH EHH AND 门 可 以 看 出 1 ШПЕО(Қ БЕЙ AND 门 可 以 看 出 1 Bj. @ 
出 为 1。 用 HCL 来 写 这 沾 网 的 函数 就 是 ; 


beol eq = (akk b | || ( la && tb |; 





H4? 检测 位 相等 的 组 台电 路 
ЕТІ ТТГ! 

КЕНЕН ЕНЕ T (ЖЕТІ bool 表明 了 这 一 点 ) (9 eq, EEA a B brut. 
MATA TLEH HCL SH T C RU ili. “= ”将 一 个 信号 名 与 一 个 表达 式 联 系 想 来 ， 不 过 
同 忆 不 一 样 ， 我 们 下 把 它 看 咸 执行 了 一 遍 计 算 井 将 关 果 放 关 存 情 朋 中 基 个 位 置 ， 相 抬 ， 它 只 是 用 一 
个 名 字 来 称谓 一 个 表达 式 ， 

EELER 


5—15 xor 的 HCL AER. sor dE PE. haath, EX xorse k Ñ £ 2. 0 АЯН 
АЖЕ? 
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图 4.10 给 出 了 男 一 个 简单 但 很 有 有 用 的 组 合 电 路 ， 称 为 多 路 复 用 器 (multiplexor)。 包 路 复 用 器 根 
T N E ile SME A -组 不 同 的 数据 信号 中 选 出 -- 个 。 在 这 个 单个 位 的 如 路 复 用 器 中 ， 册 个 数 
拱 信 号 是 输入 位 a 和 b， 控 制 信号 是 输入 位 s， 当 8 为 1 时 ， 输 出 等 于 a: 而 当 s 为 0 时 ， 输 出 等 于 
hb。 在 这 个 电路 中 ， 我 们 可 以 看 出 两 个 AND 门 决定 了 是 否 将 它们 相对 应 的 数据 输入 传送 到 OR 门 。 
当 s 为 0 时 ， 上 面 的 AND 门将 传送 信号 b《 因 为 这 个 门 的 另 一 个 输入 是 15)， 而 当 $ 为 1 时， 上面 的 
AND 门将 传送 信号 a. PROS RIKSA НСІ REA, WARR EATE PH EH 
(Е: 


bool out = ( 5 s& а} || ( !s && b}; 





m 410 单个 位 的 多 路 复 用 器 电路 
如 果 控 制 信号 s 为 1， 则 输出 等 于 输入 a: ме 为 0 时 ， 输 出 等 于 输入 hb。 


我 们 的 HCL 表达 式 很 清楚 地 表明 了 组 合适 辑 电路 和 C 中 昌 辑 表达 式 的 相似 之 处 。 它 们 都 是 用 

布尔 操作 来 对 输入 进行 计算 的 国 数 。 值 得 注意 的 是 ， 这 两 种 表达 计算 的 卢 法 之 间 有 些 区 划 ; 

° 因为 组 全 电路 是 由 一 些 尔 辑 门 组 成 的 ， 它 有 个 属性 就 是 输出 会 持 练 业 响 应 输 六 的 变化 。 如 
果 电 路 的 输入 变化 了 ， 在 一 定 的 延 退 之 后 ， 输 出 也 会 相应 地 变化 。 相 比 之 下 ，C 表达 式 只 
会 在 程序 执行 过 程 中 被 遇 到 时 才 进 行 求 值 。 

e СПРН ЈАКИ Е НОН, 0 表示 FALSE， 其 他 任何 值 帮 表示 TRUE， 而 我 们 的 
ЖЕГП HOS BERE OUR 1 进行 操作 。 

° 万 的 逻辑 表达 式 有 个 属性 就 是 它们 可 能 具 被 部 分 求 值 ,如果 一 个 AND 或 OR 操作 的 结果 只 有 用 
对 第 一 个 参数 求 值 就 能 确定 ， 那 么 就 不 用 对 第 二 个 参数 求 值 了 。 例 如 ， 这 术 一 个 CC KAR: 
( à &k la ) «к funci b, с) 

REKK func 是 不 会 被 调用 的 ， 因 为 表达 式 ( a 及 玫 1a ) 求 值 为 0。 mif Sri HERES PET 
求 值 这 条 规则 ， 逻 辑 门 只 是 简单 地 响应 它们 输入 的 变化 。 


423 字 级 的 组 合 电路 和 HCL 整数 表达 式 

通过 将 逻辑 门 组 成 一 个 更 大 的 网 ， 我 们 可 以 构造 出 能 计算 更 加 复杂 锯 数 的 组 合 迎 辑 。 通 常 ， 我 
们 设计 了 能 对 数据 宇 (data words) 进行 操作 的 电路 ,它们 是 - 些 位 级 的 信号 ,代表 “个 整数 或 一 些 
榨 制 模式 。 剑 如 ， 我 们 的 处 理 器 设计 将 包括 有 很 多 字 ， 字 的 大 小 为 4 一 32 位 ， 代 表 整 数 、 地 址 、 指 
令 代 码 和 寄存 器 标识 符 。 

块 行 宝 级 计算 的 组 合 电 路 是 根据 输入 字 的 各 个 位 ,用 逻辑 门 来 计算 输出 字 的 各 个 位 ,例如 图 4.11 
中 的 一 个 组 合 电路 ， 它 测试 两 个 32 位 字 A 和 B 是 否 相等 。 也 就 是 ， 当 是 仅 当 A& 的 每 -位 都 和 了 的 
相应 位 相等 时 ， 和 输出 才 为 1。 这 个 电路 是 用 32 个 图 49 中 所 示 的 那样 的 单个 位 相等 电路 实现 的 。 这 
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些 单个 位 电路 的 输出 用 一 个 AND 门 连 起 来 ， 形 成 了 这 个 电路 的 愉 出 ， 
A) (їй ЖЖ в) Tn? 





W 41! 字 级 相等 测试 电路 
PP A MN ат В perte. шнегі, ЕМ нс. PIS +k. 


为 了 简化 ,在 HCL h, RTBRB8 33 ЕНИН USB A imt， 而 不 指定 字 的 到 小 。 帮 特性 比较 
完善 的 硬件 描述 语言 中 ， 每 个 字 老 可 以 声明 有 特定 的 位 归 ，HCL ҖЕ Reip. ИЖЕ All 
Wr E e e kusa LETE Ede ur 

bool Eq = {А = = B ]; 

АЖЕ im ii 注意 我 们 使 用 和 —# ШЕ. “=” (Н. W “= =" 
是 相等 运算 符 。 

如 图 #.11 中 右 这 表示 的 那样 ， 在 画 字 妈 电 路 的 时 候 ， 我 们 用 中 等 硼 度 的 线束 夷 示 捕 项 字 的 单个 
МНЕ. mu dese a А ЧАЙ. 


УШ 47 
J| 5& 21H 4.6 P Eae TE ПАФ Ар HORUM, iE 4324 
Tags 3h #12 EHE SASA ж ЖЕЛДИ, 


ІҢ 4.12 SL EHE FR E ERE FEE LP. ECT FURIA AY ss 产生 一 个 32 位 的 字 Ош, 
РАТА ЧА dH В у +. THp 32 HEISE E Ж. RET FR M eT IE 4,10 
ПЕНЕН, PHIFER AAA P Hh u 32 КИШИМ. ERME- 
Ww, ЖЕН ТИНЕ. АПА>БІНЕШЗЕГІ Cinverten). ЮЖ. 

ЖПК Be EHE BUR EERTE СЕА АВГ E Sm Т. МЕШ ЕД 

AP. 在 HCL h, #Ж ИНША RER (ease) Kak EBEN. Wi tik yh Hik kin F; 
| 
select, т pu 
selecta DO up 
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select, : expr, 
| 
这 个 表达 式 包 依 一 系 询 的 情况 , 每 种 情况 i 都 有 一 个 布尔 表达 式 select 和 一 个 整数 直达 式 epr, 
前 者 表明 什么 时 候 该 选择 这 种 情况 ， 后 者 指明 的 是 返回 值 
F C 的 开关 (switch) 语 们 不 同 ， 这 里 不 要 求 不 同 的 选择 表达 武之 间 互 条 。 从 逻 料 上 讲 ， 这 些 
选择 表达 式 是 顺序 求 值 的 ， 几 第 - -个 被 求 值 为 1 的 情况 会 被 选中 。 例 如， 图 4.12 ERES yë 8 Н! 
器 用 HCL 来 描述 就 是 : 


B) Td 


int Out = [ 
B: А; 
上 : B; 





E412 字 级 多 路 复 用 器 电路 
当 控 制 信 号 s P ТАТА, ШЕВ, НСІ. 中 基 用 情况 【cease) БАЛ ЖИЕ HH Ж. 


在 这 段 代码 中 ， 常 二 个 选择 表达 式 就 是 1， 表 明 如 果 前 面 没有 情况 被 选中 ， 那 就 选择 这 种 情况 。 
这 是 HCL 中 - -种 指定 默认 畏 况 的 方法 。 几 平 所 有 的 情况 表达 式 都 是 以 此 结尾 的 。 

ЖУА ША АҒ НСІ, 代码 的 可 读 性 更 好 。 实 际 的 硬件 多 路 复 用 器 的 情 号 必须 于 
斥 ， 它 们 要 控制 哪个 输入 字 应 该 被 传送 到 输出 ， 就 像 图 4.12 中 的 信号 s 和 4。 要 将 一 个 HCL ЫҚ 
ДАА ЛАШ h, PHAR (logic synthesis). 程序 嘎 要 分 析 选 择 表达 式 集 侣 ， 并 解决 任何 可 能 的 冲 
突 ， 确 保 只 有 第 一 个 满足 的 情况 才 会 被 选中 ， 

选择 表达 式 可 以 是 任意 的 布 水 表达 式 ， 有 日 有 任意 多 的 情况 (case)。 这 就 使 得 情况 表达 式 能 描述 
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ПШНЕН). Pet Anu. An, dui Fü m PER W ESTIS: 





这 个 电路 根据 控制 信号 引 RISO, MUTAF A. B. C MD EER T. ДРАЧ В) 
进 制 数 必 为 控制 信号 。 我 们 可 以 用 HCL Ж Ж gx Tum. ШК: e THE E УС AP SR 8. 


int оиса = | 


ПЕ] k sū “ДА! РІШ 
Isi : B; # üi 
180 i Cj ¥ jt 
1 " Du Ұ IJ 


ps 

HARER CEERITULET E dos fr ВА С ЧЕЛЕГИН Т s RESO HT AL ТЕЕ ЕЕЕ 
情况 会 被 选中 , 可 以 看 到 选择 表达 式 有 时 可 以 简化 ,因为 具有 第 一 个 苞 配 的 情况 才 会 被 选中 。 TS 
第 二 个 表 这 式 可 以 写成 is1， 而 不 用 写 得 更 完 连 1s1 && 只 ， 因 为 另 一 种 可 能 51 等 于 0 已 经 出 现在 了 
ТААР Г. 

Е fid Ч, АТА О НЕЕ А. ВС hiya dh, 
ШІ FIBBI aç: 


= mtu 





用 HCL 来 表达 就 是 ， 
int Hini = | 
А == B hk А <= Ë (А; 
B <= А БЕН = ГС r Hi 
1 = Су 
l; 
елі 48 
可 这 样 一 个 电路 的 HCL Қа, PAF А. Bde C, CEP RIA, 电视 是 ， 输 出 等 于 三 个 
MA P ACT AG bm X mr, 


ЩЕП ШТ LEEREN БЕТ E PRIUS И КЕЕ. ДОКАТО СТА í RID 
ТЕМІНН, HEEEL (ALU 是 一 种 银 重 要 的 组 音 电 路 ， 转 413 HET BRI. 
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RARA HA: БНЕЗАНВНИНЯНА, LE—HEBWA. EI EBIA N bu W, 
"Biz ТН P dre НЕЕ ЖЕҢ}. jx АШ 中 画 的 四 对 操作 对 应 于 vae fo ЖУ 
FIRE БЕН. FUP Mf ik ЕЕЕ ТИЙИН ПУ (aa). ReETIETERERIMCHE (T MY 
WES, ORA A 三 去 输入 B. ALIEN, ROS TRIK TIT. sab Fb Sk m. 





图 4.13 算术 /逻辑 单元 ALU) 
BIRD IE. ТЕРИСИНЕ н. 


424 ЖЗ (Set Membership) 

НЕН ЕЕ, Siuga SES gui EsuDNE ТА ЧА НЕО, ШЕ ЖЮ 
WEITERE ip KB S Р ЧАЧСА. РЕТИ Г. АЧНА 
НЕН zc ЕВА kB 4.12 Е u Р EE SEA SD. ШЕШ: 


< hal 
Tm 





>ш 《3 0 


{АЛЕ т, ККЕ Н Н ЖЕН F MNS TZ A. B. C Ri D ЕНЕ. WETE 
的 代码 值 ， 可 以 用 相等 测试 来 表示 信号 81 和 ко ШЕ: 

Боо] БІ = code == 2 || пойт == 3: 

bool ай = code в» 1 || code == 3; 

还 有 一 种 更 简洁 的 方式 来 表示 当 сөй ЕН ЗЕРИ sl 为 1, 而 code ЕЖЕН, 3} PH s Ж 1: 

bool 51 = code in [ 2, 3 |; 

bool вй = code ia [ 1; 3 1: 


Tir SE Pp E HK CE 
iexpr in [iexpr;, jexpry --. іғірт,| 
® Ж ФИЙ expr 和 竺 匹配 的 值 бедру Геле, SERE i ot. 


425 存 情 器 和 时 钟 控制 
妞 台 电路 从 本 质 上 讲 ， 不 存储 任何 信息 。 相 反 ， 它 们 只 是 简单 地 响应 答 入 信号 ， 产 生 等 于 输入 
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PIA ERUIT PER HERE (sequential circuit), ИВАН НЕНІ НИНЕ 
MRE. Re mS A АА BRE. SITES Т ЧА 
* ОҚТЫ (ЕЖЕ) (ribi ЇЧ ШЕ. МЕНДЕР ЖЕТЕ ШП LL. 
* 随机 访问 存储器 【简称 存储 器 ) qu ЖТ. Mbk ktkt AEEA. MULUS 
fM ICT Ба. КЫК ҮТ SR. ПЕРЕ Е НЕ ТЕЕ S HERES а 
c FE —" RAE tb aoa] PE EAN: ЖИТ. Sik, ЖЕЕ ЕН. 
ft 1A32 BE Y86 кет, ЖЕРЕН ЕН (ах. %ccx 39). 

ИДП ЭП ага ЕТТІ таге 
ЕЕНЕНЕЕЯАЛКВӘНЦЕНЕ ТЕН, TEL FD E FECE UE CPU 中 
AUR EI AH. RENARD кезтаттінітігігінр, ARIS 
SUR TER BI nTELTEREBI T ВА — 1H HEEL HB. CLR IC EFE BOE FEE UE HG ЕН 
X. WHERE АН, ЧП Waspi WI “ЕНІНЕН” H “Fi EW m", 

Шаман T менн. DLS Emi T EI. KERNER. FRERE IRE 
(Fs deco, 产生 的 输出 等 于 它 的 当前 状态 。 信 和 号 治 着 寄存 器 前 面 的 组 各 还 辑 荷 播 , 这 时 ， 产 生 了 
PE SSW A (Ну т) {Н ЖЕДЕ. EIER (ЧЕНЕ. Skai 
高 电位 的 时 候 ， 输 六 估 号 就 加 载 到 害 存 器 ， 成 为 下 一 个 状态 y， 这 下 状态 就 成 为 寄存 器 的 新 输出， 
МАРЧ ЕНЕ (rising clock edge) 的 时 候 。 特 别 猎 出 的 是 寄存 器 被 作为 电路 不 同 部 分 中 的 
则 台 到 和 辑 之 问 的 屏障 。 只 有 在 每 个 时 钟 上 升 答 时 ， 值 才 会 县 寄 存 器 的 输 大 传送 利生 出 。 


ith sa Hay 





. = - HI m N 
"a "US „ уын = We n 


4.14 НЕ 
А ЗАНГА Т. Дн ET. SHP ЕН. ЕРЕН А, HH ЗЛЕ ТЕНЕ Ж. 


КИЙЕ 7 — F RE ERE RE. 





KALPTE Kiku (АЖЕ), Ed PERS (w). Шо ШЕ И 
多 评 同 时 进行 雪 个 读 和 写 操作 。 在 图 中 所 示 的 害 存 器 文件 中 ， 电 路 可 以 该 两 个 程序 寄存 器 的 值 ， 同 
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IRE SERT ЕЕН АА Ж. Amoma AERA, BH wisi EP ras, БУКИН 
— F Sb EDS ДУЕТ ЖЕН АШИ ЛАШ. ИШЕНЕ 4.4 中 编码 表示 的 寄存 器 标识 符 。 两 个 读 
端口 有 地 址 输入 srcA 和 strcRB (“source А” Ж "source B” 的 缩写 ) 和 数据 输出 vala 和 valB (4 value 
A" fli "value B” 的 缩写 )。 写 端口 有 地 址 输入 dstW C" destination W” МАҢ», UK ФИ А. valW 
("value W” 的 缩写 }。 

虽然 寄存 器 文件 不 是 组 合 电路 (因为 它 有 内 部 的 存储 ), 但 是 从 中 读 取 字 的 操作 与 以 地 址 为 输入 、 
数据 为 输出 的 一 块 组 合 远 辑 是 一 样 的 。 当 sreA 或 sreB НЕЛЯ МАНАТ, ARIER, 
相应 程序 寄存 器 的 值 就 会 出 现在 vala 或 valB F. ӨШ, YS sreA 设 为 3， 就 会 读 程 序 寄存 器 和 ebx 
的 值 ， 然 后 这 个 值 就 会 出 现在 输出 valA LE. 

时 钟 信号 按照 类 似 于 将 值 加 载 进 时 钟 寄 存 器 一 样 的 方式 控制 向 寄存 器 交 件 写 入 字 。 每 次 时 钟 上 
升 时 ， 输 入 valW 上 的 值 被 写 入 输入 dstW 上 的 寄存 器 ID 指示 的 程序 寄存 器 。 当 dstW 设 为 特殊 的 
ID 值 $ 时 ， 不 会 与 任何 程序 寄存 器 。 


43 Y86 的 顺序 (sequentia 实现 


现在 我 们 已 经 有 了 实现 Y86 处 理 器 所 需要 的 部 件 .首先 ,我 们 讲 - 个 称 为 SEQ( 取 的 是 “sequential” 
处 理 器 的 意思 ) 的 处 理 器 . 每 个 时 钟 周期 上 ，SEQ 执行 用 来 处 理 一 条 完整 指令 所 需 的 所 有 步骤 。 不 过 
这 需要 一 个 很 长 的 时 钟 周期 时 间 , 因此 时 名 周期 频率 会 低 到 不 可 接受 。 我们 开发 SEQ 的 日 标 就 是 提供 
实现 我 们 最 终日 的 的 第 一 步 ， 我 们 的 最 终 目 的 是 实现 一 个 高 效 的 、 流 水 线 化 的 处 理 器 。 


4.3.1 将 处 理 组 织 成 阶段 
通常 ， 处 理 一 条 指令 包括 很 客 操 作 。 我 们 将 它们 组 织 成 某 个 特殊 的 阶段 序列 ， 使 得 即使 措 仿 的 
动作 差异 很 大 ， 但 所 有 的 指令 都 遵循 统 - -的 序列 。 每 一 步 的 具体 处 理 取 决 于 正在 执行 的 指令 。 创 建 
这 么 一 个 框架 使 我 们 能 够 设计 一 个 能 充分 利用 硬 柏 的 处 理 器 。 下 面 是 关于 各 个 阶段 以 及 各 阶段 内 执 
行 操作 的 简略 描述 : 
ө HUB tfetech)， 取 指 阶 段 从 存 赃 器 读 入 指令 ,地址 为 程序 计数 器 PC) 的 值 。 从 指令 中 抽取 
出 指令 指示 符 字 节 的 两 个 四 位 部 分 ， 称 为 iode 指令 代码 ) A ifm GE-S UU BEO. СЕНГЕН 
出 一 个 寄存 器 指示 村 字 节 ， 指 明 一 个 或 两 个 寄存 路 操作 数 指示 符 rA 和 rB。 它 还 可 能 取出 
一 个 四 字 节 常数 字 vatC。 它 按 顺 序 方式 计算 当前 指令 的 下 一 条 指令 的 地 址 үзір, Б ЖАЙ, 
vaP 等 于 PC 的 值 加 上 已 取出 指令 的 长 度 。 
e 解码 (decode): 解码 阶段 从 寄存 器 文件 读 人 最 多 两 个 操作 数 ， 得 到 值 valA 和 /或 valB. Ñ 
常 ， 它 读 入 指令 rA 和 IB 字段 指明 的 寄存 器 ， 不 过 有 些 指令 是 读 寄存 器 %esp В]. 
е 执行 (execute): 在 执行 阶段 ， 算 术 / 逐 辑 单 元 (ALU) 要 么 执行 指令 指明 的 操作 【根据 ifun 
的 信 】， 计 算 存 情 器 引用 的 有 效 地 址 ， 要 么 增 即 或 减少 栈 指针 。 我 们 称 得 到 的 情 为 valE, 在 
此 ,也 可 能 设置 条 件 码 。 对 一 条 距 转 指令 来 说 ， 这 个 阶段 会 检验 条 件 码 各 (ifun 给 出 的 ) 
分 支 条 人 忻 ， 看 是 不 是 应 该 选择 分 支 。 
е Uifz Gnemory?: 访 存 阶段 可 以 将 数据 写 入 存 情 器 ,或 者 从 存储 器 读 出 数据 , 读 出 的 值 为 valM。 
* tjs] write Басю): 与 回 阶段 最 多 可 以 号 两 个 结果 到 寄存 器 文件 。 
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* 更 新 PC (PC update); 将 PC 设置 成 下 一 条 指令 的 地 址 。 

处 理 器 无 限制 地 循环 执行 这 些 阶段 ， 只 有 在 遇 到 halt 指令 或 一 些 错误 情况 时 ， 才 会 停 下 来 。 我 
们 处 理 的 错误 情况 包括 非法 存储 器 地 址 《程序 地 址 或 数据 地 址 )， 以 及 非法 指令 。 

从 前 面 的 讲述 可 以 看 出 , 执行 “条 指令 是 需要 进行 很 多 处 理 的 。 不 仪 要 执行 指令 所 表明 的 井 作 ， 
还 昌 汁 算 地 址 、 更 新 栈 指针 ， 以 及 确定 下 :条 指令 的 地 址 。 幸 好 每 条 指令 的 整个 流程 部 比较 相似 。 
因为 我 们 想 使 硬件 数量 尽 忆 能 的 少 ， 并 且 最 终 将 把 它 映射 到 -个 二 维 的 集成 电路 蕊 片 的 表面 ，- 个 
莫 常 简单 而 一 每 的 结构 是 非常 重要 的 。 降 低 复杂 虚 的 一 种 方法 是 让 不 同 的 指令 共享 尽量 多 的 本 件 。 
例如 ， 我 们 的 每 个 处 理 器 设计 部 只 含有 一 个 算术 ;逻辑 单 邢 ， 根 据 所 执行 的 指令 类 型 的 不 同 ， 它 的 性 
用 方式 也 不 同 。 人 在 姨 件 上 复制 逻辑 卖 的 成 本 比 软件 中 有 重复 代 公 的 成 本 大 得 多 ， 而 及 在 奸 件 系 统 中 
处 理 许 多 特殊 情况 和 特性 改 比 用 软件 来 处 理 朵 难得 多 ， 

我 们 面临 的 一 个 挑战 是 将 每 条 不 同 指令 所 需要 的 计算 旋 信 到 上 述 那 个 通明 框架 中 。 我 们 会 使 用 贸 
4.15 中 所 水 的 代码 来 描述 不 同 Y86 指令 的 处 理 。 图 4.16 一 图 4.19 中 的 表 描述 了 不 同 Y86 指令 在 各 个 
阶段 是 上 息 璋 处 理 的 。 要 好 好 研究 一 下 这 些 表 ， 表 中 的 这 种 赂 式 很 容易 蜡 射 到 硬件 ， 这 些 表 中 的 每 iT 
都 描述 了 -个 信号 或 存储 状态 的 分 配 《 用 分 配 袍 作 志 来 表示 )。 阅 读 时 可 以 抬 它 看 成 是 从 上 至 下 的 顺 
序 求 值 。 后 面 我 们 将 这 些 计算 映射 到 硬件 对 ， 会 发 现 其 实 并 不 需要 严格 按照 咏 序 来 执行 这 些 求 值 ， 
Пх900: 308209000000 


= 


irmovl $9, *edx 


2 ПхООБ: 308315000000 1 irmovl 521, $&ebx 

3 0х00с: 6123 | subl edx, %ерх # subtract 

à Üxüde: 3068480000000 | irmovl 5128, %езр # Practice Prob. 4.9 
5 0x014: 404364000000 | rmmovl €$esp, 100{%еБх) # store 

Š ПхО1а: а028 | push. Фейх # push 

7 0x0lc: 1068 | рор %єах # Practice Prob. 4.10 
8 Dx0le: 7328000000 | je done # Not taken 

9 0x023: 8029000000 | call prec & Practice Prob, 4.13 
10  Dx028: | done: 

11 Цх028: 19 | halt 

-2 0x029: | proc: 

3 020279: 80 | ret # Return 


图 4.15 Y86 指令 序列 示例 
我 们 会 通过 各 个 阶段 来 跟踪 计 些 指令 的 处 理 ， 


图 4.16 给 出 了 ОРІ СЕНДЕ). mmol (寄存 器 -寄存 器 传送 ) 和 irmovl GLUIDC- SE f£ 
SEXO 类 型 的 指令 所 需 的 处 理 。 让 我 们 先 来 考虑 一 下 整数 操作 。 国 不 图 4.2， 可 以 看 到 我 们 小 心 
WERE THS, AA MARERE Саба. subl, andi 和 хо) 有 着 相同 的 icods 值 。 我 们 可 以 
以 相同 的 步骤 上 顺序 米 处 理 它 们 ， 除 了 ALU 计算 必须 根据 ifun 中 编码 的 具体 的 指令 操作 来 小 定 。 

整数 操 划 指令 的 处 理 凡 特 上面 列 出 的 通用 模式 。 和 在 到 指 阶段 ,我们 不 需 开 常数 字 ， 所 以 valP 的 
ИЙЛЕ РС + 2。 在 解码 阶段 ， 我 们 要 读 两 个 操作 数 ， 香 执 行 阶段 ， 它 们 和 功能 指示 符 ifun - -起 再 
提供 给 ALU， 然 后 valE 内 放 入 指令 结果 。 这 个 计算 是 用 表达 式 valB ОР valA 来 表达 的 ， 这 申 OP 
代表 ifun 指定 的 操作 。 上 里 注意 两 个 参数 的 顺序 一 一 这 个 顺序 与 Y86 (和 IA32) 852] 4558 HA. i 
如 ， 指 令 subl %еах, Фейх, Я К ебх] - Rf%eax] 的 慎 。 这些 指令 在 访 存 阶段 什么 也 不 做 ， 而 
在 写 回 阶段 ，valE SAATE B. 然后 PC 设 为 valP， 理 个 指令 的 执行 就 结束 了 。 
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| Gp (À, rB ктш] rh, rB Lrnov] V, Ë 
кн киеп = МРС] собе: Ни = МРС] кобейип = МРС] 
ATB = МРС] АТВ — МРС 1) ГАВ -- МРС+1] 
мис — МРГ+2| 
| val? 一 Рс? vaP — РС+2 wP — PCS 
| "m = TO vaih — НА] 
| vaig — Afra] ë 
AT valE — mld ОР vai 
| , E ~ П+ҥшЁ = aE 
saco — | 9 у" 
" ит ! 
WB | RE] — val | |] — val E Bir] — 
š | PC ~ мар Is: vai | РС = ушр 


Ж415 YB& 指令 ОРІ. rrmovi xa irmmovi — 

КЕНЕНІ ond. BAD ЕДЕР. ЕН кесене E El УЕ ҮТИ ЕНЕ. ІН тат EIE EUIS 

WINTERS. cn Mis БЕШИ СН ІШІНЕ Юю EF, ТЕКЕЙ ЫШ SENT. 
ЕН, ibfUD A ded de subl ЗНАЕ РЕ, а ARHEIBALIS 56 HA AH 

3 行 中 的 жм, АПТАНЫ HART Д едх Бесік dme ied 04e 21. ЕҢ 

看 到 指 寺 是 位 于 地 址 Ох00с, FAAEE, Sp] Ыб de 0x23. kR app FAO, £ 

边 列 出 了 处 理 一 小 OP 者 邻 的 通用 的 规则 (Шал) ЖЕШИН n e RAM HEN, 





йн nA Жл м, TEE a: ECTE S "eee 设 成 了 12, Ed dendi 
m. T D, m PC ЖТ 2, 


Wir mmol fi RH r ie Wi, Жы, RADRODUR НЕН. 我们 特 ALU 的 


M2 Ka 

————M——————————— 
5-.ТЖАНАО, ЖЕШ СЕРЕН, AA] valE = val, Pp HES TA FI ms ger 
忻 。 对 irmovl ЕНІНЕН. BET ALU 80538 А ERE ча. ялы NX EE, 
t] F imod. ЙЕ ЕДЕД 6. 所 有 这 些 指 村 者 不 改变 条 忻 码 ， 

Жуа 

МТ —48, i GRE EHE Е 4.15 ФЕ kung LEE irmo а н НЕЯ: 











та | 通用 H # 
| | | irmovl %128, Февр 
LT. codedun — МРС} 
wG — M.PCa2] 

| хаР — РС+& 

шы 
r 
ЕТ. 
жк [eus ЕХЕ 


ik dedii 1 Jer e ЯЬ РС ©? 


ІҢ 4.17 ИН T EAR Н rmmovl 和 mrmovl 所 需要 的 外 理 ， 基本 流程 也 和 前 面 一 样 ， 不 
过 起 用 ALU 来 加 valC 和 ralB， 垃 到 存储 器 操作 的 有 效 地 址 (RS ӘЖЕНІҢ WD. ірін 
ЕНІ. НАНЫН vala ҢІН, ЕЛІҢ ушм. 





кїн]. ҒА, Dri 















| ky содейігі = МРС icode:um = МРС] 
MrB = МРС+1| ПАВ = MPO] 
wal 一 М{РС+2| мас — M,PC«2] 





4.17 Y86 fd rmmovi s mmo EUER EH NE 
РНЕ КЫ, 


“= 
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iL fn & ЖЖ 415 P НИИ Ж SHE Mittaa. тың, наты 
LFA зары Т 128. ебх AE subl de (E Z H) ЖЕ ER 2. ЮГ 
看 到 ， 指 他 位 于 地 址 Ox014. ЖЕ, WB AÉ 0045 0643, а Ox 00000064 

CriEMA 100) &Y S RICE (AI НН. ҤЕ TF: 
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ALIE ins ЖӨН, ERARE 123 АЛАМЫН 112. ЖЙРСЫС, 


PH 4.18 Er UE T ЖЕЕ pushl 和 popl R ЧЕЧЕ, {ПШ ЕЗІН) Y86 hy T, 1926 


ЕКЕ RPM. Y WINNIE. НЕН AYNI BETTE 
PARREREN. 






pushl rå 








icode-Hun + МЫРС 
rA TB = МҰРС1) 


ГАЈА — МРС+1] 






vali — PG+2 





aP — PG+2 
















МВА == R[rÁ] ҰША — Насар) 
| (Yala — Aitean] aE = Н{%әнр] | 
Ыш valE = valB.;4) vaE 一 walB+4 | 
Lu | МІМІЕ) — vela | мам = MAQA] 


T 
| 


R[kesp| = valE Нізеер| — valE 
А[гА тата 


чы WE — 
к m PC — уар 


图 4.18 YB $ pushi 和 рор! TEILE SEE bl HE 
ЖИН А EROR, 
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pushi Tl JF Ip dg @ Rer Tr rr ЕНЕ. R A WEN, ЕНтер fr na dme 
БЕКІНУ, 特 栈 指 计 赋值 为 valB。 在 执行 阶段 ， 用 ALU ЖИНИНЕ 4. MUT а тағың 
写 的 地 址 ， 在 写 回 阶段 还 会 存 回 到 %esp b. ШЕ 作为 写 操 作 的 地 址 ， 是 遵 福 了 YRS (11432) 
后 惯例 ， 也 就 是 在 写 之 前 ，pushl 应 该 先 将 栈 指针 碱 去 4， 即 他 术 指 奸 的 更 新 实际 上 是 在 存储 器 拖 作 
元 成 之 后 才 进 行 的 ， 


Xf. BUR push f iet T 

让 我 们 条 看 看 图 4.15 ФИКИ 641 E mmov B4 HORE HL. к. £ A E edidi 
89, AFFE Sepii 128. A ETLICHE e Ox Ta, ЖЕЛЕР. {5% 
Ожай 和 (x28, S rR bt F: | 





койкі = Miloxübc]zs :0 
AE = Mjoxoldjz:8 


ҮӨР — хй1а+@=бхб1с 


WWG TASR Кай G, dE HAR «ер ІМ, НОЩ AE 124， 并 将 PC 
Ж 2, 


pop! 指令 的 执行 与 pushl fff dA d. ШТ {ЕШШ RE НЕ cH 以 和 外。 这样 做 看 上 去 是 
很 名 杂 ， 但 是 我 们 会 看 到 让 walA 和 vab MIRRA., ЕШ НІНЕ Ho ABR ІНІН, 
IR T PREE RUE. ERTER. 用 ALU HUBER a, (REDDE 4 ONU W TE D Ft 
于 操作 的 地 址 。 在 写 回 阶段 ， 楼 用 加 过 4 ШЫН КНЫН E HERE. ЖЕНЕ ТА EE M, 
fé ЕНЕ. ШАШ a ЖИДЕ НЕШЕ ERR RE, Т Үз (和 ТАЗ?) HIER pop МІЗ 
ЙГЕ, ЕКОШ. 


SJE 4.10 
ШЕТШ, ТАЛАНА BM 415 ИЗЕР L popl 48.4 &j 4t sP Hr X. 


ТЕТІГІ 245 


тн ан | Ай | 


popl ГА | popl %аак 














ЕТ кобейип — МРС! 
АВ = МИРОН) 
I wP 一 PC+2 
inis жША 一 月 Wasp] 
IT: 
NH 


кек 


5] 4.11 T А қы | 
根据 图 4.18 Ф| dik. Rh pushl esp Ф & AE P i X? i658 934 44 F Жж ñ YB6 
HE — 97 
8:2] 4.12 | ad | ч 
| КЕ popl занат кй pA 3 HERR 4.18 F| £j EF HEFT, pop %евр dr eji 
ESAT? G54s2É Asa TO YRS JUPE ATA 7 
图 4.19 表明 了 我 们 的 三 类 控制 转移 指 专 的 处 理 ， 各 种 跳 转 、eall те, TUEA, ПЕН 
是 面 逢 令 一 样 的 幕 体 流 程 来 实现 这 些 指 地 ， 








ҰША — Ajtesp] 


| vali -- Н[%авр| 


РС — Bon? valC:valP 


E419? YB T ж. cal 和 ret 在 贤 序 实现 申 的 计算 





BARS ЕКИН Н. 


2 аз 


ЕНЕ РЕ ВЕ. ЕПЕРЫ-НН-БЛАЕНІНЯ ТЕН». ГЕ rsln КЕ ИЕТ 
ЧЕН Xx EAS PEDE. ЖЕШ de i RR EB И ЕК ЛЫН EB. БЕГЕШ 
EW ra; ЛҮК. ЧАШ. ПЕРЕН ЕР ЖЕ Е L SEEN X. ^+ 
出 一 站 一己 信号 Bch。 在 更 新 РС ВТЕ, ЗЮ НХ TE. MORI QS M 1. WH PC Л valC 
(Bi EO. ШО, ЖЕУ valP ( F — IBS EJE HE), ПИ Жк Са ULT. СӘТЕН 
Жы, Ра, "xr MED €T. 


Wut. ME je 指令 的 执行 

оф 415 v Ede Y ad E je AAt. subl dd Жі! ELE RT 
Ж deb RARE AT 0. Wu Ер К. i EHE TAE Onde, 45 TET. 第 一 个 字 节 的 慎 
3 0х73, AS T mop 33 Е DxO0000028 ЕТА q RS R. iacu Bde, 5” 
8-42 AENEA T 


Mi mom 


kode'lun — МРС] | aan = 机 asia 














ман = Muoxülf)soxo28 
хаР = ПкПіеі-0к023 






РС < 0?0й28:0х023 + Dacz3 
кы deis n t UR, ФАН M PC * 5. 


ІҢ» сай 和 ret. 与 指令 pushl 和 рор] ЖШ. ЕТЕНЕ И ЖЕНИП А РЕТ НЕ СДУ. xp 
call, ЖП уар, НИЕ сай íi iW IR I ЖЕНЕ ТИАН. ЖАҢ. ТЕ PEE, Ж 
PC ЕЗ «ac. 也 长 是 调用 的 目的 地 。 革 痢 专 ret， 在 更 新 PC 阶段 我们 将 кам, ABE. 
ЙЧ PC. 


"ЕХ 4.13 
ШЕТА Е 3. AYTTI RMAURIEE YEA КӨЖЕНІ: 


E Ж É НЕ, - 





-— 















icoda-Hun == МРС] 


vBlC =- М|РС+1] 
valP — PU+5 





ма = F|wesp] 





| vwE — WalBH — — 


-іш Мај] — ҹар | П  — 


Afta im] J- МЕ -— ШЕ 


т. ulli wd —  — J U 


RER rAdurREBATZAE. рг HARE 
ANRA ЖЕ а P E ded Ж ІЗ ret 特 全 的 钼 理 情 况 。 指令 的 好 址 是 09009, | 


PEL лылы). te Hur 9и Жен оов АЖ ЕТЕШ 
мн 124, быны ді ША: (02858676485 














ҰША = R[tesp] #124 t 


[WE 7 Aitean] sina 
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AL kiasa OR RE, АЕ ИЯ W PC i (кіз. hah dei khi. 05-448 
Фер Е 0 Т 128. 


АПШ T Т НЕ АЕ. EENAA TARRA Y86 ih. Н BDI АЕ ЧН. {Н 
Кар Ry Ар А MCN FEE, MERNE ЖИЕ ЕДС В ЕВА, HE 
它们 连接 起 来 。 


432 SEQ 硬件 结构 
ШИН Y86 指令 所 需要 的 计算 可 以 被 蛆 织 成 六 个 目 本 阶段 : X. MED. fair. Vir. "lH 
Н РС. B 420 rib T — Pie Т ei ERU Ет. FEIER HE EBD 
在 图 中 左下 和 角 《【 标 了 "PC MARRANA (EH riki SARENET XL. 
НӘ. ИИН 1: Жл, (hardware units ) ЇЙ ririk АБЖЕ, КАЙБЕР I FI EU iu, 
ВТЕ РЕЛ ЗЕ НАС, ПАРЫН. КЕШЕК Tp in ie. 
MWB T КЕЕН РЕ ЕТЕНЕ ЛЫН H BE hk т. PI BUE. Pros lq nis 
німен, RIL ЕШ DO Bi ik le PERS ТЕНИП ҤЕ ИИИ KEE 
нн, Ж ПЕН А A Bu m IN. 
V PER oc ts PET AE BEI НН: 
RR: НЕТИНВЯ ҒАНЫН, ЧЕ FIS IK ЗЕКЕТ. PC HS (РС 
incrementer) ТРЕЙ хаїР. DAMT ЕРЕ ЖЕ. 
НЕ, ЖЕЙТШ ЛЫП АЮВ. WEB MAIN GERE ГЕЙ val 和 valB. 
АЛТИ ЕНЕН HAT. # ЖОЕ Ил (АШ) HT PII BEST. ЖЕТ, 
КЕҢІТЕ НИИ НЕЙ. ЯҢ. Eel» ТЕ ЕТЕ NEM НІНЕ, ЕН 
ИН Hi, SSBERNWSORIDO. ГА ЯШ, 
ЗРЕО ТЕЕ ССС 有 三 个 条 人 忻 码 仁 。ALU IEEE PESCE. “ЧАТ ЖЕШНЕН. 
ЕНЕ МЕНЕ ЖИ ЖІП 8 Beh. 
Мы EATUR MEFE Cdaamemory) iki А Trimmer. Hv NEUE 
(Fab riga. TIER Р ЖЕЙН Н H. 
SED ЕВРЕ ТУП. ОПЕНУ АТО ИНАНА. fx M ИЖ A 
在 情 器 中 读 出 的 值 ， 
图 4.21 тынын TH SEQ FEES FE C WH DT S OPE EPF, RT 23 АЕ 
mero. Sus ER HEN Ел. НЕЗЕНИННЕНЕТ, CAUNET 
лт, ТИНЕ КЕМЕНІ. 
а ФАЛАК НА и, ТЕА Е. ALU FS. GYM THIS PER 
实现 中 ， 帮 会 使 用 这 一 组 基本 的 单元 。 我 们 把 这 些 单元 看 成“ 黑 意 子 "， AO U ЕЧП ЕВ 
Tw. 

. def AL S ESERISEA TH, НЕ ЛА И ЧИ ТТА. «АШ Ж 
Пт АШ. ӘПИЯ, ЧЕШИ НСІ. 描述 ， 

. 31 £T Ë 6 EB ФИ АЕН, EREADER mp TET ME. 

s. ЖЖЖИНИ + ЫА А т. ЧЕ ТИК ЛЫ 32 gH. 
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井 列 地 连 在 一 起 ， 将 字 从 硬件 的 一 个 部 分 传送 到 另 一 部 分 。 











新 РС 
НЕЕ | 
(PCI 
“ИН 
au 
alz 
nei ы EE] Тау N 
аша ан 
Wi 
ide. dun 
rA, rË 
майс. 
ШЖ Б РС 
таныды | ды 


图 4.20 SEQIMMIEIEH, -HEFIR 
hm ripe E BEBO ЖЕШКЕН НІН. AREE (PC) Шетін, mimi RAO. 


€ XARÀSTTARTURERSENGHET. НИН ЕГО, ВЕ ЈЕУ: 
и ERE BR ЕГІЗІ 
. XE AE EX AUR. BREGA Ecce RPSL. 
A 416 一 天 本 雪 中 所 有 的 计算 都 有 这 样 的 性 质 ， 每 一 行 帮 代 表 某 个 值 的 计算 ， 如 vaP. ЖЖ 
HATTE лс, 如 存储 器 。 图 4.22 的 第 二 栏 列 出 了 这 些 计 算 和 动作 。 阶 了 我 们 已 经 讲 过 的 那些 依 
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Ws. ЖШТ ИНЕШ ID SSE, sA, val& |Н) sB. valB ІНІН; dE. НАЛ valE 的 首 
ІНЕ, ELS dsiM, ҢА valM 的 寄存 器 ， 
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селені. DUB) A 


койа:йип — МРС) Node':fun — МАРС) 
rA, r8 гАТВ -- М,[РС+1] r&rB -- Mj[PC«1] 
valG val — МРС+Л2! 
valP valP — PC+2 valP — РС+6 


= ШОШЫП lam 

valB, srcB valB + R[rB] valB -- НІН) 

=—= B ТУ 
Cond codes —— CC 
















icode, ifun 















mw | мам — vaM ~ MvalE] | 
m p dstE R[rB] 一 valE 
ET Ee dath ар — үз! 


pc-vwp | -- vBhlP PG= vaP | -- valP 


图 4.22 标识 顺序 实现 中 的 不 同 计算 步 又 
Ж ТАЊ SEQ 的 凡 段 中 正在 被 计算 的 值 ， 或 止 在 被 执行 的 操作 。 作 为 示例 给 出 的 是 指令 ОРІ 和 mmol 的 计算 。 


Rh. imr НИЈЕ 38 OP] 和 mrmovl 的 计算 ， 来 说 明 要 计算 的 值 ， 要 将 这 些 计 算 呐 射 
到 矿 件 上 ， 我 们 要 实现 控制 逻辑 ， 它 能 在 不 同 硬性 单元 之 闻 情 送 数 据 ， 以 及 操作 这 些 单元 ‘ 即 对 每 
个 不 问 的 指令 执行 指定 的 运算 )， 这 就 是 控制 逻辑 块 的 日 标 ， 控 制 逻辑 块 在 图 4.21 PHREN UT 
框 表示 。 我 们 的 任务 战 是 着 手 每 个 阶段 ， 创 建 出 这 些 块 的 详细 设计 。 


4.3.3 SEQ ЕРЕ (timing) 

ОНАН 4.16--Ж 4.19 时， 我 们 说 过 阅读 的 时 候 要 把 它们 看 成 是 用 程序 符号 写 的 ， 那 些 赋值 是 
从 上 到 卡 顺序 执行 的 。 然 而 ， 图 4.21 中 硬件 结构 的 操作 运行 根本 完全 不 同 。 让 我 们 来 看 看 这 些 磷 件 
是 怎样 实现 表 中 列 出 的 那些 行为 的 。 

我 们 的 SEQ 的 实现 包括 组 全 逻辑 和 两 种 存储 器 设备 : 时 和 钟 控制 的 寄存 器 “程序 计数 器 和 条 忻 码 
寄存 器 ) 和 随机 访问 存 情 器 《寄存 器 文件 、 指 令 存 依 器 和 数据 存 情 器 }。 组 合 进 辑 不 需 时 任何 定 序 
(sequencing) 或 控制 一 一 只 要 输入 变化 了 ， 值 就 通过 逻辑 门 网 络 传 播 。 正 如 我 们 提 到 过 的 那样 ， 我 
们 将 谈 央 机 访问 存储 器 看 成 和 组 合 逻辑 一 样 的 操作 ， 根 据 地 址 输入 产生 输 乌 字 。 因 为 我 们 的 指令 存 
屠 器 只 用 来 读 指令 ， 因 此 我 们 可 以 将 这 个 单元 看 成 组 合 远 辑 。 

现在 还 剩 四 个 硬件 单元 需要 对 它们 的 定 序 (sequencing ) 进行 明确 的 控制 -一 程序 计数 器 .条 件 
码 寄 丫 器、 数据 存储 器 和 寄存 器 文件 。 这 些 单元 是 通过 一 个 时 钟 信号 来 控制 的 ， 它 触发 将 新 值 装 载 
到 寄存 器 以 及 将 值 写 到 产 机 访问 存储 器 。 每 个 时 钟 周期 ， 程 序 计数 器 都 会 装载 新 的 指令 地 址 。 只 有 
在 执行 整数 运算 指令 时 ， 才 会 装载 条 件 码 寄存 器 ， 只 有 在 执行 rmmovl. pushi 或 call 指令 时 ， 才 会 
马 数 据 人 存储器。 寄存 器 文件 的 两 个 写 端 口 多 许 每 个 时 钟 局 期 更 新 两 个 程序 寄存 器 ， 不 过 我 们 可 以 用 
特殊 的 寄存 器 ID 8 作为 端口 地 址 ， 来 表明 在 此 端 日 不 府 该 执行 写 操作 

深 制 我 们 处 理 器 中 活动 的 定 序 《〈《sequencing )， 只 需 查 寄 存 器 和 存储 器 的 时 钟 控制 。 我 们 的 硬件 
菊 得 了 就 好 像 图 4.16~ 留 419 中 那些 赋值 顺序 执行 一 样 的 效果 , 即使 所 有 的 状态 更 新 实际 上 同时 发 
生 ， 上 用 只 在 时 钟 上 升 开 始 下 一 个 周期 时 。 之 所 以 能 保持 这 样 的 等 价 性 ， 是 由 于 Y86 指令 集 的 本 质 ， 
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也 是 由 于 我 们 按照 尊 御 以 下 原则 的 方式 来 组 织 计 算 的 : 

“处 理 器 从 来 不 需要 为 了 完成 一 条 指令 的 执行 而 去 读 由 该 指令 更 新 的 状态 。” 
这 条 原则 对 我 们 实现 的 成 功 来 说 至 关 童 要 ， 

ГАН, RRAK push 指令 是 先 将 锅 esp 8.4, НИЕНІ ТІФевр (BTE STERN 
地 址 .这 种 方法 就 间 前 面 所 说 的 那个 原则 相 违 背 . 为 了 执行 存储 器 操作 ， 它 需要 先 从 寄存 器 文件 中 
读 更 新 过 的 栈 指针 。 而 我 们 的 实现 【图 4.18) 产生 出 减 过 了 的 栈 指针 值 ， 作 为 信号 valE， 然 后 再 用 
这 个 入 号 既 作 为 寄存 器 写 的 数据 ， 也 作为 存储 器 写 的 地 址 。 因 此 ， 在 时 钟 上 升 开 始 下 一 个 周期 时 ， 
КЕ АЙДЫНЫН f. 

再 举 个 例子 来 说 天 一 下 这 条 原则 ， 我 们 可 以 看 到 有 些 指令 《整数 运算 ) 会 设置 条 件 码 ， 有 些 指 
(ҚЫНА) 会 读 取 条 什 码 ， 但 没有 指令 必须 既 设 置 又 读 取 条 件 码 ， 昌 然 要 到 时 钟 上 升 开 始 下 一 
个 周期 时 ， 才 会 设置 条 件 到 ， 但 是 在 任何 指令 试图 读 之 前 ， 它 们 都 会 更 新 好 的 。 

面 这 段 伐 三 是 汇编 代码 ， 左 边 列 出 的 是 指令 邮 址 ， 图 4.23 给 出 了 SEQ ФР ЕЛГЕН ИҢ? 
第 3 和 第 4 行 指令 的 : 


1 0х000: irmovl 50х00, ерх # eby <-- 0100 

2 0х006: irmovl 50х200,%ейх # %ейх «-- 0x200 

3 OxóQüc: addl *edx,$*ebx Ж ebx <-- 0x100 CC «-- 000 
4 0x0De: Je dest # Not taken 

5 бх013: rmmovi Ферх,О01%ейх) # MIOX200] <-- 0x300 

6 0х019: dest: halt 


标号 为 1~4 ff& T EHI ТТМ Ж, X888. UARA Gas Z Emi. £83 
ЕНЕ, 因为 有 的 组 合 逻 辑 (例如 ALU) 产 生 输 入 到 条 件 码 寄存 器 , 和 而 其 他 部 分 5 例 
如 分 支 计算 和 PC 选择 逻辑 ) 又 将 条 件 芭 寄存 器 作为 输入 ， 图 中 寄存 器 文件 和 数据 存储 器 有 分 离 的 读 
连接 和 写 和 连接 ， 因 为 读 操 作 沿 着 这 些 单元 传播 ， 就 好 像 它 们 是 组 合 逻 辑 ， 而 写 操 作 是 由 时 钟 控制 的 。 

图 4.23 中 的 代 妈 表明 电路 信号 是 如 何 与 正在 被 执行 的 不 同 指令 相 联 系 的 。 REOR REX Je Mo 
置 条 忻 码 开 始 的 ， 按 照 ZF. SF 和 OF 的 顺序 ， 设 为 100。 在 时 钟 周 期 3 开始 的 时 想 CAR OD. des 
ЛКЕН E SB A inmo 指令 (第 二 行 ) RAS. ИЗВЕЛ mI. SEX 
色 圾 示 ， 表 明 它 还 没有 来 得 及 对 变化 了 的 状态 做 出 反应 。 时 钟 周期 开始 时 ， 地 址 OxO0c 载 入 程序 计 
数 器 中 。 这 样 就 会 取出 和 处 理 用 浅 藉 色 表 未 的 ай 指令 (第 二 行 )。 值 沿 着 组 合 膛 辑 流 动 ， 包 括 读 
随 析 访问 存储 器 。 在 这 个 周期 末尾 (点 2), ШЕШ ЕЛДЙ ИРЕ ТИҢ (000)， 更 新 了 程序 寄 
存 器 名 ebx， 以 及 程序 计数 器 的 新 值 C0x00e)。 在 此 时 , 组 合 逻 辑 已 经 根据 addi 指令 ОН Kf ЗО 
被 更 新 了 ， 但 是 状态 还 是 保持 着 第 二 条 irmevl 指令 (用 中 度 灰 色 表 示 ) 设置 的 值 。 

当时 和 铂 江 天 开 妈 周期 4 时 《点 3)， 会 更 新 程序 计数 器、 寄存 器 文件 和 条 件 码 寄存 器 ， 因 此 我 们 
用 线条 色 来 表示 ， 但 是 组 合 逻辑 还 没有 对 这 些 变化 艇 出 反应 ， 所 以 用 自 色 表 示 。 在 这 个 周期 内 ， 会 
取出 并 执行 je 指令 第 四 行 )， 在 图 中 用 深 永 色 表 示 。 因 为 条 件 码 ZF 为 0， 所 以 不 会 选择 分 支 。 在 
ЖААЖ (m 4)， 程 序 计 数 器 已 经 产生 了 新 值 0x00e。 组 合 逻 辑 已 经 根据 je 指令 CARGOS K 
ЛО 被 更 新 过 了 ， 人 是 直到 下 个 周期 开始 ， 状 态 还 是 保持 着 ааа 165 (НЖЖ) WEM. 

如 此 司 所 示 ， 用 时 钟 来 控制 状态 元 素 的 更 新 ， 以 及 值 通过 组 合 逻 辑 来 传播 ， 足够 控制 我 们 SEQ 
实现 中 每 条 指令 执行 的 计算 了 。 每 次 时 钟 由 低 变 高 时 ， 处 理 器 开始 执行 一 条 新 指令 。 
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4,34 SEQ 的 阶段 实现 

在 本 市 中 ， 我 们 会 设计 实现 SEQ 所 需要 的 控制 逻辑 块 的 HCL 描述 。SEQ 的 了 有 HCL 描述 请 
SARDE A 的 A2 部 分 。 在 此 ， 我 们 给 出 一些 讽 了 ,而 其 他 的 只 是 作为 纺 习 题 。 我 们 建议 你 用 这 些 
练习 米 检验 你 的 理解 ， 芭 这 些 块 是 如 何 与 不 辣 指令 的 计算 党 求 相 联系 的 ， 

我 们 在 这 上 几 疫 有 讲 共 那 部 分 SEQ 的 HCL 描述 ， 是 不 同 整数 和 布尔 信号 前 定义 ， 它 们 可 以 作为 
HCL 操作 的 参数 。 其 中 息 括 不 同 硬件 信号 的 名 字 ， 以 及 不 问 指 令 代 但 的 常数 人 寄存 堪 名 科 和 和 ALU 
BE. B 4.24 н ГЛИНЕ. ЕЯ, ЖЗНЕ КУ, 


а сіла 


INOP 
IHALT 
IRRMOVL 
IIRMOVL 
[RMMOYL 
IMRMOVL 
IOPL 

IJXX 
ICALL 
IRET 
IPUSHI. 
IPOPL 


— 


nop 18 > P3 E 
halt 8 ФИА 
теуі 18 МҚ 5 
rmov] 指令 的 代码 
mmol {Б ЕНЕҢ 
mrmoy] ffe ird 
整数 运算 指令 的 已 码 
prie ds ККЕ 
call #9 

ret $8 НІҢ 
pushl Jë BH Cas 
popl 指令 的 代码 


wesp WI A tF a3 TD 
НЫН ЖТР 38 LE UT 5] 


8424 НСІ 描述 中 使 用 的 常数 值 
这 些 值 描述 的 是 指 信 的 编码 、 寄 存 器 YD 以 及 ALU 操作 。 


ЕТІН 416--Ш 4.19 中 所 示 的 指令 以 外 ， 我 们 还 和 包括 了 对 nop 和 hatt 指令 的 处 理 . 这 上 条 指 念 
都 蚌 简 单 地 经 过 各 个 阶段 ， 不 进行 任何 处 理 , 除了 要 将 PC 1. 我们 不 会 介绍 halt 指令 实际 上 如 何 
AEA АНЯ, АЕ Ё ЫЙ icode A 1 ВЧ, ЖИ КЖ. 

Qnm 

如 图 4.25 所 示 ， 取 指 阶段 包括 指令 存储 器 信件 单元 。 以 PC TEAGÉ- TES CEYO Buh, 
这 个 单元 -~ 次 从 存储 右 读 出 六 个 字 节 。 第 一 个 字 季 坡 当 成 指令 字 节 ，( 被 标号 为 “Split” 的 单元 ) 分 
为 两 个 并 位 的 量 icode 和 ifun, Ж icode 的 值 ， 我 们 可 以 计算 二 个 一 位 章 信 号 СН ЖЛ: 

instr valid: 这 个 字 节 对 应 于 个 合法 的 Y86 指令 吗 ? 这 个 信号 用 来 发 现 不 合法 的 指令 。 

need regids: 这 个 指令 包括 个 寄存 器 指示 符 字 季 吗 ? 

need valC; iX 1E p Ejih-- CT? 

让 我 们 再 来 看 AP] f, need regids 的 HCL 描述 只 是 确定 了 code 的 值 是 否 是 -条 带 有 寄存 器 
指示 值 池 全 的 指令 ， 


bool need regids - 


l 
2 
3 
4 
5 
6 
7 
5 
9 
à 
b 
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icode in { IRRMOVL, ICPL, IPUSHL, IPOPL, 
IIKMOVL, IRMMOVL, IMRMOVL 1; 
xe йл гї е wal 





425 SEG MIKRE 
HPC E АИБА. МЕНИ REBA IUE h. А, REAA RS PERO. PC ШШЕН 9 уыр. 


5 3B 4.14 
5 dk SEQ 实现 中 信号 need ха 的 HCL (535, 


如 图 4.25 Br, Ml frase hiki iM F T ECRIRE T ATE шы Pe. 
Бел "Align" (UBER теі, REIR АЖ НЕЕ АКЕ, "БІРНЕ 
need regids 为 Hj, 5 1 被 分 开 转 入 寄存 器 指示 符 rA 和 HB h, EMI, 这 两 个 字段 会 被 设 为 8 

СКМОМЕ), 表明 这 条 指令 没有 指明 寄存 器 [E] MI F CIBAGO, 任何 只 有 一 个 寄存 器 操作 烙 的 指 乌 ， 
针 存 器 指示 值 字 节 的 另 一 个 字段 都 设 为 8 (RNONEY。 因 此 ， АГАТЕ Е rA в ЖИ. ЖАН 
ЖГНЕ ӨНҮ. Ж, ЖШШЕ АЕА ЛЕШ. КЕ “Align” 的 单元 还 产生 常数 宇 
valC. 根据 信号 need regids ТШ. ЖАШ РЇ 1—4 来 产生 үш, EAE 2-5 来 产生 ， 

PC NIB Cincrementer) 独 忻 单元 根据 当前 的 PC 以 及 两 个 全 号 need _rmegids 和 need_valC 的 值 ， 
ЗЕН зар. 对 于 PC ff p. seed regids (Ñ r 以 及 need_valC (fo i， 境 加 器 产生 信 peradi. 

MS RIS HERE 

ІН 426 «ib T SEQ PERRERA Ee] B si T E APUL ИЮ ЕК E ЕРІ) 
ETHER f] Ж ва 

W FB MET ГЈ. ЕЖЕНИН ИНИН GERD А BMB kE) HATS (CAO ЕЙ 
M 上 ) р САДЕ НЕ А Ж ЕШ. ti — wu ID. ОЕ 3 32 e 
Fr. ЖЕШ U W fr ТІННІҢ? (Н ЕГЖЕЙ), 也 可 以 作为 它 的 输入 字 (Чп ЖЕ). 
Wi ERI ОАЕ А. А acA 和 sreB， 而 两 个 写 滑 口 的 寺 址 输入 为 asta 各 du, ШЫНЫН 
H Li БАА (RNONE), SS Ж, 

WO UB) icode 以 及 寄存 器 指示 慎 rh RU rB, ІН 426 WW IT Hh ЕШ ЦР e i] Р 
器 文 件 的 寄存 器 ID. WFE ID sreA ЖАНЫН ЕТЕ ЕЕ vala. ӨТ ЧЕ PO LE HA TR 
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XA. ШШ 4.16-- R81 4.19 PIERDE BERE hL: 将 所 有 这 些 条 目 都 整合 到 一 个 计算 中 起 得 到 
F 面 的 srcA 的 HCL 描述 【回想 一 下 RESP R %csp 的 寄存 器 ID); 
int areh = | 
jcede іп ( IRHMOVL, IRMMOVL, IOPL, IFUSHL | : TA; 
ісіне in | IBSOPL, IRET } : RESP; 
l| : RNONE; # Don t need register 





icoda А 18 


图 4.20 SEQ 解码 和 瑟 回 阶段 
отип. ПЕРСЕ РЕНЕА ТН (m TUNES TS) fW. Jom pem pp s НЕ 
ҰША BrvalB, ТУЕНА valE FG valM ЕЕЕ. 
53H 4.15 
TARTE асв ААШ Е нав. "Ü$4&gsüd 8416-18 419 ФАН 
I3 = fP Ит. EGE srcB 的 HCL 48. 
ЕНЕ ID dsE ЕНІП ЕНЕ, AAEN valE НІКІСЕНІ, ШІН 4.16--4.19 
ПІН НІҢ МЕН. АТА ЕКЕНИ НИ IE, КИНИ КЕН dsuE 的 HCL ВШ: 
int dstE = | 
icode in { IRRMOVL, IIRMOVL, IOPL ) : rB; 
icode in [ IPUSHL, IPOPL, ICALL, IRET ) : RESP; 
1 : REHOHE: # Поп" E need гепіягег 
1: 
练习 是 4.16 
ЖЗА IDduM ASFA МЕНАТА. ИН Т Ж НЧА valM ЖА ЁЛЕ. dei 
416-7 ВАРЕНИ ФИН. Жш dsiM 的 HCL AA. 


ХОН 4.17 

只 有 popl АНЕТА АНВАТ Еос, ЖҒНЕ popl esp, E tr M Bib 
ЕЯЫҚЫ-ТАаны. 3 җн ЕЕ. ЭТИМАЛ TRES Ad ebore T N 8 iT 
EH, H-E, Ш-ДА О АЩ ЕРДЕН, RE E о 
ЯЯЯ, XESTERAÉIJHMASTATHMTÀS, Ж-А с KE A Бє ЖЖ? 
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тй 
ТИВЕН ИЕ ЕЩ й (АЛ. itx 
根据 alufun 情 号 的 证 置 ， 对 输入 aua 和 aluB 执行 
ADD. SUBTRACT. AND 或 EXCLUSIVE.OR 运算 ， 
ШВ 4.27 таг, ARERR RR HA g А ЕН ТЕЧЕ 
产生 的 ，ALU 的 输出 就 是 valE 189. 
ТЕ 4.16— 8 4.19 9, 执行 阶段 的 第 一 个 步 村 蔡 | 
ШЖ ДА ЖН] АШ ИЯ. ИШЕ aluB сода Mun We WA чей 
在 前 面 ， 后 面 是 aluA, ARA TRE вшм JR2 
ҰША 喊 去 valB,。 我 们 可 以 看 到 ,根据 指 地 的 得 型 ,alaA E427 SEQ MIRI 
ЖИЙ Ж valA. valC. а н. НЮ Ч AAEREN RAITHE, EATER. 
ТЕ SEL ВК d, DERRHNTS, Eins. 
int àluA = | 
icnde in 1 IRBMOVL, ТОРІ | = ValA; 
icade in { IIRMOVL, IRMMOVL, IMRMOVL ) : wal: 
icode in | ICALL, IPUSHL ) + -4; 


icode іп | IRET, IPOPL р : 4; 
É Other instructions don' t need АШ 





$M 4.18 
ҚЫН 4.16 - IE 419 PF]. — p 65€ Н, E SEQ 中 信号 шив 的 HCL iik, 
ҚАП! 在 执行 阶段 执行 的 振作 ,我 们 可 以 看 到 它 通 常 是 作为 加 法 器 来 使 用 的 。 不 过 ， 对 于 OPI 
9, RITE SIE EFE dE fun 字段 中 篇 码 的 操作 。 因 此 ， 我 们 可 以 雷 ALU 控制 的 HCL dieti. 
inE alufun = | 
ісейе == ТОР : jfun: 
1 : ALUADD; 
li 
执行 阶段 还 包括 条 件 四 寄存 器 ， ЕТЕ, 我 们 的 АШ 都 滞 产 生 三 个 与 条 性 三 相关 的 信 
5--%. 符 导 和 和 灌 出 ， 不 过 ， 我 们 只 希望 在 执行 OPI hh 3 0 W E PERS. ЕНІ ET - 
信号 set, cc 来 控制 是 殖 读 更 新 条 忻 码 寄存 占 : 
bool set cc = icode in { ТОР |; 
| кол “ком” FIRE SGL AGE -ЖІНФЕНЗЖИН GEH THAO, ЖИБЕ Н Е - Xf 
T СЛЕ О. HEERS Већ. H SH 4 k — HOPES (icode 等 于 IDOO, HH AES 
WW kya TE C IUE fin 中 1 ЕЯНЖАНФЕ (LEID EB О SEWER. R 
BETREUER T EP EE. 
НІНЕ 
irs Bir FI EE Ae dk EE SERERE. ШШ 428 BUS. 两 个 控制 峡 产 生存 储 器 地 址 和 存储 
WARA W CEBE 的 值 。 届 外 两 个 据 产 生 吉 明 应 该 执行 小 操作 还 是 写 措 必 的 种 制 信号 。 当 站 
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(ПЕНЕН, ШЕТШЕ ЕЙ уам. 





icode «МЕ — val чай? 


ВЕ 4,28 SEQ 访 存 阶段 
Br mU". uju ie k ñami. Horne ne d nt W R: T E ушм. 


每 个 指令 类 型 所 涡 要 的 存 情 器 操作 在 图 上.16~- I8 4. 19 ЕВА Е Rr ШЕТ. ПШ ВИЙ 
ЖИЕНІ ЕЕ valE Ж vala. ЖЕН HCL 描述 就 是 ， 

int mem addr s | 

іссіе in | IRMMOVL, IPUSHL, ICALL, IMRMOWVL } : vàalE: 

icode іп { IPOPL, IRET } : аід 

ё Other instructions don t need address 

l; 

ЈА 419 

ЖЕ 416- 4,19 Po ERI BR FEM. АГ Ж 6 BEC e ded d. val 
ж хаР. БІН SEQ PẸ mem dara 的 HCL ЗА, 


RAPUR А W au Sit y pu ESU Н mem read. H| HCL {К Ж: Ж. 


bool mem read = icode in ( IMRMOVL, IPOPL, IRET |: 
练习 是 420 
RA 38 А. 5 6) 65 8 BEBE ҤЕ #40 Ё e| HEP теп write. E ik SEQ 中 入 号 mem, write 的 
НСІ. 15,54, 
更 新 PC HEEL 
SEQ PEK- F HrP0 ЕЕ ЕЖЕТ ИШИН (BD 429). ШЕ 416—108 4,19 中 最 后 些 巴 所 
yo ТЇНТ ЖИН ЕЕЕ IE РС 可 能 是 valC. valM EE шр. M НСІ. 来 描述 这 
ELITS 
Int new pc = | 
# Call. Use instructior constant 
leode == ICALL + valt: 


# Taken branch. Use instruction constant 
icodg == IJIXX EE Ach : valc; 
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š Completion of RET instruction. Dse value from stark 
icOde za IRET : valM; 

Ё Defauit: Use Incremented PC 

1 : valP; 





icode Bch ма мМ valf 
429 SEQ 更 新 PC 阶段 
HW QPRP ЖЕЕ. ME al. ушм 和 val Hih Е PC ІН, 


现在 我 们 已 经 浏览 过 Y 处 理 器 的 一 沾 完整 的 设计 ,我 们 可 以 看 到 , i HL RH #5 
所 壬 的 步 允 组 织 成 一 个 统一 的 流程 ， 就 可 以 用 根 少量 的 各 种 硬件 单元 以 及 一 个 时 慎 来 控制 计算 的 吴 
序 ， 从 而 宰 现 炉 个 处 理 器 。 址 过 这 样 一 来 ， 控 制 还 辑 就 名 须 要 在 这 些 单元 之 问 路 由 恼 号 ， 并 根据 指 
他 村 型 和 分 支 条 忻 产生 适当 前 掉 制 信和 号 。 

SEQ ТЇ С-КЕ КЕТ. 时 钟 攻 闫 非 过 估 ， 以 使 信号 能 在 一 个 周期 内 传播 过 所 有 的 阶段 。 
让 我 们 来 看 看 处 理 一 条 ret 指令 的 例子 ， 在 时 钟 周期 起 冶 时 ， 从 更 新 过 的 PC 开始 ， 机 从 指令 存 依 器 
ЧЕНИ. MTR ERRAR АШ 要 减 小 栈 指针 ， 为 了 得 到 程序 计数 器 的 下 一 个 值 ， 
述 监 从 存 鱼 器 中 读 出 返回 地 址 。 所 有 这 一 切 都 从 频 在 这 个 周期 结束 之 前 完成 。 

这 种 实现 方法 平 能 这 分 利用 硬件 单元 ， 因 为 时 个 单元 只 在 整个 时 钟 周期 的 一 部 个 时 间 内 才 被 恒 
用 ， 我 们 会 看 到 引入 泪水 线 能 获得 更 好 的 性 能 ， 


435 SEQ+ 重新 安排 计算 阶段 

作为 到 入 本 战 化 的 遇 计 的 一 个 中 间 步 肝 ， 我 们 特 重新 排列 这 六 丫 赃 度 的 凑 序 ， 使 得 更 新 PC ШЇ 
段 在 一 个 周期 开始 时 执行 ， 而 不 是 铺 东 时 才 热 行 ， 这 样 产生 的 交 理 器 设计 称 丸 SEQ. HAET 
了 基本 的 SEQ ЖИН. RARER LETE IH EB PC IN ИМЕНЕ Y 
ЖЕР САРЕ ВЕСА О, driburfibrgrimislMl 0M те: Н+ Rip), 

如 图 430 所 示 ， 我 们 能 称 动 PC PER, ШЕННЕН, iN BW Hi PC 
ІҢ. Жа PC fig Uo CLA SUDIBETER. МЕНЕНИНШЕЙЛЫМҢН-НЕЕТ. Өтен 
ІНШІ, fre EIE PC (HERE NER. t (itat W E 
图 中 是 用 标号 为 “FSiate” (LA “previous state”) 的 方 柜 来 表示 的 。 现 在 PC 阶段 的 任务 变 成 了 为 
当前 指令 选择 PC 人， 而 不 是 为 下 一 条 指 志 计算 更 新 了 的 PC。 

图 431 给 出 了 $BQ+ 础 人 忻 的 一 个 更 为 详 曙 的 说 明 。 我 们 可 以 看 到 ， 它 包括 与 我 们 在 SEQ 中 用 到 
的 【图 4.21) 一 样 曾 硬 件 单元 和 控制 块 ， 具 不 过 PC 逐 辑 称 到 了 底部 ， 从 前 面 is УЕ S 
НЕШЕ Т, TIP S R EIB BL try (ñ AmE FW 4 "p" (tg 
“previous”, 
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аА, aluB 


ҮНІМ, vai 


Ti fli 





94.30 ЗЕСТ 
(THE. ЖЩ ЕНЕНЕ (PC) АЕ НЕА Б ДА, Л 
BERT SHSC— Tao e dE) ERI 





valE, vet 


TENAR F R 


ux pug 
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ЕЕ: — шс w -— == = ж = = = Е Е ы = „= = - z - === 






„бетэ ° |] 


ESETT PC 


| 
ТН В | 
| | 
ТВ 


(EI | 
| pes TEE A 











围 4.31 сент 


шет ане. 


ЖЕРИ РНЕ со ДЕВ рте Т PC УНЕ, ЕЕЕ САТАА А. РАХ АЧ TEX 
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ІҢ T SEQ RI SEQ«IF] PC 计算 块 ， 
А) SEQ Eri PC 的 计算 8» SEQ. fi PC itd 





Beh vait velM wal рағы зас |ә 
Ed. ЕТЕСИН-БМІКЖЕН, ЖЕНЖЕН ДАБ РЈ Е А PC ИЙЕ Ie EE Pi 
TA. xx ОЕ 6 R M Ku, Feu dede qe (сисин retiming). 重 定时 改变 了 一 个 系 
"md du. НЕЛЛИЛРЕННІТА. ШЕН ЖЕ ТЮ Т АТУ РЕ ЕЩ ЕА. 
PC 计算 的 HCL mif e Т: 
int ре = | 
& Cali. Оке instruction constant 
plIcode == ICALL : Walt; 
8 Taken branch. Use instruction constant 
plcode == І7ХХ && pBch : руа1с; 
Е completion of RET instruction. Use value from stack 
pleode zz IRET : pVAlH; 
K Default: Use incremented FC 
| + pYalP: 


Ж A PJ A.3 节 是 SEQ TEE НСІ, #036. 

Xf. SEQ+ 中 的 PCERE? | ' 

SEQ — k АЧЕН Ё, илаа ан какалиыя. HER. SRE- 
ИФТ dot HE SUE E ab iX PC М. ШД t4) Mis, G BAAT a a s 
В ISA repr e ЕЕН ЛЖ ЖЖ БЕТИ, КЕЛЕ л АНЕ Жын. 
BIDEESEMGSETELEXASÉE WS Ж.Ж днн, S Eum ЕЖА qm 
HR {[ 例如， 程序 计数 器 ) җн, EeESOEB EE EH T. АПФР 
ЖМ. ТТФ Я. Ж Courof-arder ) 星 理 技术 ， ilira ЭЙР айына 
Жазы. SR—ERBE&IEHTUUH. ' 


44 流水 线 的 通用 原理 


(БЕНЕН TREES] YES 处 理 器 之 前 , URL IHRE OK HR IE DEG IC 63 ILL IE 
KES.GNTWEZBHHKINBSÓLLEmSSEITRSIx/A CENE А. WS AES АЖ 
ARP. {КЕЖИК SEU, HATERA LT ЕТ ТЕШЛИ. ЕНТ. Gss 
ИИИ Р. EX. MALERE. EEMI P. АИЫН ЖЕНТ. ЖА. | 
师 和 烘 干 ， 通 营 模 会 允许 才 个 顾 害 同时 经 过 系统 ， 而 不 是 要 等 到 一 个 用 卢 完 成 了 所 有 从头 芋 尾 的 过 
程 才 让 上 一 个 开 冶 。 在 一 个 典型 的 自助 瞩 厅 流水 厂 上 ， 顾 客 按照 相同 的 顺序 既 过 各 站 阶段 ， 即 使 他 
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WAS KR, КЕН. SWEA ЕЛА ЖИИ А ИШЕН. Р — ИГ e 
АКИТА Г. HW. POESIE HIN NORTE. ЖҰ. 

i xU — REEF MEHR MET W bK YJ kak Crhroughpar), 183 ЈА Cr fa] рч РІЗ 
ЖШ. ^ir ЕНЕНЕ n Г 1 tiameney)， 也 就 是 服务 一 个 用 户 需要 的 时 间 。 虱 如 ,自助 
虑 厅 蛙 的 一 个 内 需要 补 拉 的 顾客 ， 能 往 快 通过 一 个 韭 济 水 线 化 的 系统 ， 只 在 沙拉 阶段 稍 做 超 留 。 但 
КЕ КЕЧЕН ЕНЕР. manu PLE dre p Mr ИЯ ИНЕНІ КЕНЕНІ T. 

441 TW kk 

LATEA W Bi Wa KE ER. ЕНІП "ИК ЖЫНЫ НЗИВНАНЕІН-Е 2. 
Н 4.32 8b T А ТАЕЧКА ТЕ ОНЕ РР АНИ Т. БЕН- ЗЕТІН E 7 IUE 
ТЕШ {ГЕШ АЙЧ. ВРА УМЕН hp r ty rr alls) ima rik. CD WWW h wm 
ЖОКЕ TEA: ЖАНБАС Shi, HSE АНДАШ ETE, РЕ 
(ws. MPR ARRASTI Kai, RERHESETH—SSIEMNI]T. ФЕ де Ч E EE 
之 后 :输出 就 或 为 了 输入 的 某 个 函数 ， 

A) Wt. ЖЖ ЖАНЫП 
300 ра | | ?90ps 





Иб = ope — 
ШШ = 3.12 GOPS 


КЖЕ 


кей | | 
9% кщ -一 
图 432 菲 流 水 钱 化 的 计算 硬性 
има ЛЕГІ ӨЕ. OBB ИТТЕН ЛЕГЕ. 


ЮЕШ ИР. ИҢЕ ЕЩЕ E (picosecond. WF "ps", ШЕШЕ jr", Ж 
HEL КАР, ПЕШАК E Хор, minds rmm 20р». НАУИ Т— 
种 时 序 图 ， 称 为 流水 厂 围 (pipeline diagram). ШІН, Еа Е. ЕРГЕН НЧЕ 
[在 此 称 汶 OPI. OP2 和 Op3)， 宰 心 的 长 方形 囊 示 执行 这 些 操作 的 时 间 ， 这 个 笠 钱 中 ， 在 开始 下 
-FREZIER F. ЕШ, mujer m F APA E R. FATA 
T mira + &2R FR КҰН, 

loperation HOO picosecond - 
Thoughput- amisqa sana, нн Мен 

ЗОР КВНЕ (SH ООРУ), ШАЛЫН, D DOR E Н. А3 

HERT- iE BERE E ДЕЕ ШШ dot] Cheney). (EE Bem. ATB 320ps. Н ДЕ 
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Tent MP 

假设 将 我 们 的 系统 执行 的 计算 分 成 三 个 阶段 (A. B RIC), МЕНЕЕ Ops, ШІН 423 Ж 
示 。 热 后 在 各 个 阶段 之 问 放 上 流 永 线 守 看 器 (pipeline registers}， 这样 每 个 操作 都 全 按照 三 步 经 过 这 
个 系统 ， 从 头 到 尾 需 要 三 个 完整 的 时 种 周期 。 怒 图 +33 中 的 流水 线 图 所 示 ， 只 要 OPI M A ША B. 
就 可 以 让 OP2 ЖАШ А Т. ЖЗНЕ, (RES F. 三 个 阶段 部 应 该 是 铬 动 的 每 个 时 钟 周 期 
在 阶段 C，DP2 在 阶段 B. 而 ОРЗ 是 在 阶段 A. 在 这 个 系统 中 , 我 们 将 时 钟 周 期 设 为 100430=120ps， 
得 到 的 看 吐 术 大 的 为 &330OPS。 因 为 钼 理 一 条 操作 需要 3 个 时 钟 周期 ， 所 以 这 条 流 永 线 的 执行 时 
Ше 3X%120=360ps。 我 们 梅香 统 看 吐 量 提 高 到 原来 的 8.3У3.12-2 67 们 ,代价 是 增加 了 一 些 硬件 ， 
以 及 执行 时 间 的 少量 增加 【360320=1.12)。 执行 时 间 变 大 是 由 于 增加 的 流水 厂 害 存 器 的 时 间 开 铺 。 


A Wit. = жа 


ШЕ = 360 ps 
HR = B.33 GOPS 





8433 HRAS EAE 
IER REI HEEL A. B 和 C. BEER 20 PR. АИТ ВА. 
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A Т ШАНК КЕ ЖЕЕ Т. EBI, ІП ЕЖЖ ИНЕ ЛЕЯНЫН. [ 4.34 € 
出 了 前 面 我 们 看 到 过 的 三 阶段 流水 线 【 图 水 33) DRE. ОКА ВА ЕЗЕН ВЕ, db 
ӘШІР (ЕМЕН ЕНІНЕН ЖЕЛМІН. ЯНА 120ps， 信 号 从 0 TEE 1， 开 始 流 水 线 阶 段 的 下 
一 起 计算 ， 





图 4.34 = ЮЖ ЖЕ ДНР 
неңінш LARME HACK ВНЕ НГЕ — HERE. 


266 ба 





И, WEA Pit ARNE OP2 的 值 已 经 到 达 第 一 个 流水 线 寄存 器 的 输 和 ,但 是 起 冀 存 器 的 状态 和 
输出 还 保持 为 操作 ОРІ 在 阶段 A 中 计算 的 值 。 换 作 ОР! 在 阶段 B 中 计算 的 值 已 经 到 达 第 二 个 这 水 
Ha BIEN. ЭИ ЕЛЫ. ЖЛ, ЖЕКЕ. dos Fra mg Cn 2). 为 
jb. ШШ А ОНА ИШЕНЕР: OP3 ТІРЕ. MG НЕШЕ БЕРЕН ЗЕН С 3). 
ЖЁН! #3 abt ib ЕШИКЕ Ceurved wavefront ЖЕЙИН. (E Eo REEL [I ЖЩ] & 
个 不 同 的 部 分 。 在 时 刻 360 之 前 ， 蛙 时 值 到 达 沪 水 总 寄存 器 的 输入 【点 4) 当时 刘 ЖОН ЕЗІ, 
各 个 操作 会 前 进 缀 过 一 个 流水 线 阶 段 ， 

МА ЖЕН ЕНЕ. elTe bl i ЗАА РНЕ ЛЕШЕ КЕЙИТ As 18% 
{Ж sed ЕЛ А. HRH EW ЕЛЕ Л botipi Faik. 9 jr. ШИИ 
тіке, ГАСА О ВЕ. ries Rl Hp SEM, НИЗМ ЕТЕ. ЖН 
AMPS SE h. 

енг SEQ ARAR Ae C433 T. 346 S ЖЕНЕН S EIER 2 [DERI IHE RE 
ШЙ Lb, ДЕНЕШ e rp re EST. MER PRI EO ЕЛЯ FE. RITE IE RR 
ж ПИЖЕШ ТЕ, SH TIN. 


443 流水 线 的 局 限 性 

图 水 妇 的 例子 始 出 了 一 个 理想 的 认 水 贱 化 的 系统 ， 在 这 个 系 屿 中 ， 我 们 可 以 将 计算 分 成 三 个 相 
互 扣 立 的 阶段 ， 鳃 个 阶段 需要 的 时 间 是 原来 运 辑 圳 要 时 间 的 三 分 之 一 。 不 率 的 是 ， 还 有 其 乙 一 旦 因 
apii Kiki Ж. 

平一 致 的 划分 

图 4.36 展示 的 系统 中 ， 和 前 面 一 样 ， 我 们 将 计算 划分 为 了 三 个 阶段 , 但 是 通过 这 些 阶 段 的 迁 退 从 
50ps 到 150ps 不 等 。 通 过 所 有 阶段 的 延 过 和 仍 拓 为 00ps。 不 过 ， 我 们 运行 时 钟 的 速率 是 由 最 慢 的 阶 
段 的 速度 限制 的 ， 正 如 本 图 中 沪 术 线 图 表明 的 那样 РНН, НА ШЕН CHEER 
F) е, ENE С 2509 dp. AANA B 会 一 直 处 于 活动 状态 。 我 们 灾 涡 将 时 钟 则 期 设 为 
150420«170ps, Їй ЖЖ. MOS 5.88 GOPS. ІНГЕН Т. 执行 时 间 也 增加 到 了 $10ps; 

аә. =н. ЖЕНЕ 
5üps Sips 150рв 10 20р: 






Шіз- STD ps 
| fr ü= 5 BB GOPS 








图 4.35 ”由 不 一 致 的 阶段 王妃 造 成 的 流水 钱塘 术 的 局 限 性 
а Е Ер 
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UNE RICE UR. AESi H n R SR I] REIR ЕВ E71 ERRA. 通常， 
ЕТТЕН д, 如 ALU AFRE ЕТІЕНШІНЕ e Ev pois. ik ЖЕЙ 
鹿 建 一 组 平 街 的 阶段 非常 困难。 在 设计 我 们 的 流水 线 化 的 уве 处 理 器 中 ,我们 不 会 过 于 英 注 这 一 野 
寥 的 幼 闻 ， 但 是 理解 时 序 优 化 在 实际 系统 设计 中 的 重要 性 还 是 非常 重要 的 。 
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RRAN ИЩ 432 ФЕ, дй 6 tik, Bub £3 A-F МЕРИЯ 
80. 30. 60. 50. 70 de ]0ps， 加 下 图 所 示 : 

варь Он эз ыз Top 10р 2008 





fiii ЫШ АК ЕЕ. Ж НИЕ А. ME UTE dA ox 
TAB. ЕБЕНЛИНЙЖАЛЯ (ЖЛЕ) PËR kS tüm. ЕВБЕЯ ДЕ 
ШОЛЕ SE y Ops. 

А. Rd ТЕ BEST ARRA ER BEER LG GE EGER AR ТЕШ? 
dol dr odi ЕЛГЕН ДЕ 

B. £4 ААА Н ES Y Ж Eg. dE 1- Ж & ЖЕБЕ Ж? Eodem 
ЕЗ 

C. Ф АЕННАН НВ ЖАҚЫ, dp ДИНДЕ ЗЕ) Ба еф 
R $ y" 

О.Б $Ë Жк. РЛ БЕНИ? M d kd EH AS Eu pHi, 

РЕ, zu FM 

[Н 4.37 iE HH T DECR PICKS) T RR. x TOP. RIV W RT өсе ET 
ИГИГЕ 50р. (Ef EL (nh P UK Hol ИЕТ —1-АШИ ЖЖ. ik EGET 
ҰНЫ S0220a70ps, ЯН) 14,29 GOPS. ШЖ, ЖЖЖ ЖИНАК ИШ ë, НІНЕН 
m f 142983-171. ЖЕНГЕН ЕИ ИЕНЕН ИНЕШ TS. (НЕН TIE ЖЕ ЖЕН 
mus. РАГА НТ. AEEA T W Kik Ж T BESSER K. TER h, K+ 
ЖЕН RIT Rem ep ШИШ) 28 69. 

REHEAT HAHAE ЖИ THBISE CIS E E£)ELBO Ж Ж. ШЕЖЕ 
"rir tri or ЖЯ ИЯ. РЕВА Е ИНЕ)». IER E REGI HB ЕИ 
КӨРЕ. НОНЕ ШЕ К. ДЕК ЕН Ж ЕСИНЕ НН ЫН. ШШШ 
МӘН ЕНІН, ЖАПА ЕЕН АЕ НЕ RR E 2 M A 

ЊУ 4.22 

VAI AR RE 432 ФЕН, WEDA E AERAN, FARRA AR Е im, de 
XH GEB d AN ШЕ S хув, Sd EIER уж? 
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50 ps Т 50 рь T 30 ра "m" Әрі 20ра Spa 20/84 Spa 





тн Hit-420ps Ф = 1428 GOP5 


图 4.57 HEBR ROT GRE SOR ІНГІ 
i Pr SE AR al, dU LEEREN T ЕМЕ. 


444 ” 带 反 馈 的 流水 钱 系 统 

到 目前 为 止 : АРЕ PRS НИКЕ, LEETE. A EEY. 
ШЖ. BE. HFR 1A32 或 YB6 IXFESRTT LIE REI P5 PORE И, iH HHR 22 BBB 
a HERES). Иш. Ж F 02834 Y86 fe UTE. 


2 11 (Ñ Gets 
1 mrmovl 100i |, %ейх 


EATER SPRF. Bee B ИНЕ НИН Ж (data dependency), ИШ 
Tr d£ eres E MUERTE 9:Ж Ы. imo fli CE — 10 ЖЕШКЕН E tean dh, Ж 
addi 指令 【第 二 行 》 要 读 这 个 值 ， 而 add 指令 特 它 的 周 果 存放 在 ebx P, mmo 指令 【第 三 行 》 
gigi THE. 

43 HEX EISE КЕЙПТЕ НК Cequential dependency). ЖЖЖ КІШІ“ ҮНІН 
S ES. 





1 loop: 
2 subl edi, tebax 
1 jne targ 
4 irmovl $10,%гейх 
5 jmp loop 
б Еага: 
І һа14 

jne d (C59 — 1) ЧЕ ГЕЧЕ X (control dependency), ЛЖ ИШ ИЕЫ НЕН И 
1ТЕН Ж imei $ñ CANIT) 还 是 al 指 亏 【第 七 行 )， 在 我 们 的 SEO 设计 中 ， 这 些 相 甘 
ЖШ БЕЙНЕ ЖИД. ШШ алло ал. ЕБ ИІН КЕННЕН 
件 ， 将 新 的 PC 值 传送 到 PC ЖЕН. 

图 4.38 举例 说 明了 特 液 水 线 引 入 告 有 反馈 路 径 的 系统 中 的 危险 。 在 原来 的 系统 CA) h, Ң 
T HERES ЖЕ Е-Е, HOKERIE (B) ИНТЕ ЯН, ОРІ ІШЕ Ж ОР? 的 
输入 ， 使 此 类 推 。 恕 果 我 们 试图 将 它 转 换 成 一 个 三 阶段 流 本 贱 (С). MORRER ANTA. W 
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ЖК Н (C) pas. ОРІ 的 站 果 成 为 OP4 ВА. ГАИА K ЕЕ, im T 
ЖЕНТ А. 

"RA HEHDKEEBORSIA vase ERAN. ЖП ЕЕЕ ЕШ. ҮН]. (RN 4,35 
' e£ Muya стри TIERE. RIT ELA gr CE AERE mi ЕКЕНИН X, 
ШЕЙИТ Ж Б ISA w ELO ЕН. 


A) BT: КАЛЯ. wu 





qu 





图 458 ШЕНЕП ЕКЕН ЖЕМЕ 
t Moi Hbi БИЕП ЕҢ CAO ЕЕЕ ЖЕШ ЕШ ісу ШИР. ПЕ Tim emn dy. WU Rd 
ЖАШ BAD dqEIEX. 


270 %4% 


4.5 Y86 的 流水 线 实现 


我 们 终于 准备 好 要 开始 本 章 的 十 要 任务 一 设计 一 个 流水 线 化 的 Y86 处 理 器 了 。 我们 开始 时 以 
SEQ+ 作 为 基础 ,在 各 个 阶段 之 间 洪 加 流水 线 寄 邦 器。 我 们 最 初 并 不 尝试 正确 地 处 理 不 同 内 数据 和 和 欣 
市 相关 。 不 过 ， 经 过 一 些 修 改 ， 我 们 将 达到 日 的 ， 得 到 一 个 实现 Y86 ISA 的 、 有 效 的 、 流 水 线 代 的 
ADR RR 


45.1 插入 流水 线 育 存 器 

在 我 们 创建 一 个 流水 线 化 的 Y86 处 理 器 的 最 初 尝试 中 ， 我 们 要 在 SEQ+ 的 各 个 阶段 之 间 插 入 流 
AKA. pepe ШИЙ ТИИ, 82] PIPE- 处 理 器 ， 这 里 名 字 中 的 “- ”代表 这 个 处 理 器 有 
战 终 的 姓 理 器 设计 相 比 ， 性 能 要 差 一 点 。PIPE- 的 抽象 结构 如 图 4.39 Бок. Wok ERRAT 
用 浅 此 色 方 杠 表 示 。 每 个 寄存 器 时 以 存放 多 个 字 节 和 字 ， 待 会 我 们 会 看 到 。 可 以 栅 察 到 PIPE- 使 用 
的 硬性 单元 与 我 们 的 两 个 顺序 设计 : SEQ (图 4.20) 和 SEQ+ (图 430) 完全 一 样 。 

HEKER Ж АФ ТОЛ ЖАЗ: 

F 保存 程序 计数 器 的 预测 值 ， 待 会 儿 会 讨论 。 

D 下 于 邮 措 积 解 得 阶段 之 间 。 它 保存 关于 最 新 取出 的 指令 的 信息 ， 即 将 由 解码 阶段 进行 处 理 。 

E 位 于 解码 种 执行 阶段 之 间 。 它 保存 关于 最 新 解码 的 指令 和 从 寄存 点 文件 读 出 的 值 的 信息 ， 
即将 出 执行 阶段 进行 处 理 。 

M 生 于 执行 和 访 存 阶段 之 间 。 它 保存 最 新 执行 的 指令 的 结果 ， 如 将 出 访 存 阶段 进行 处 理 ， 它 
还 保存 六 于 用 于 粕 旦 条 人 忻 转 称 的 分 支 条 件 和 分 支 日 标的 信息 。 

到 ”人 己 十 访 存 阶段 和 反馈 路 径 之 间 ， 反 馈 路 径 将 计算 出 来 的 值 提供 给 客人 在 器 文件 扎 ， 而 当 完 成 
ret fH 9 8], "EXE PCOREEXE SEHR ÜGRTEU BE. 

图 4.40 表明 的 是 下 面 这 段 代码 序列 是 怎样 道 过 我 们 的 五 防 段 流水 线 的 , 其 中 对 各 条 指令 的 注释 
Ю 1-15 Жл: 

irmovl 51,%еах ВІ 


1 

2 irmovl 52, %есх 
3 irmrov] $3,%еах 
4 
5 


Hn 
| 


irmovl 54,Жжесх #1 
halt # Т 


+ 
Б-р 
Lr ым ua Му н 


图 中 右边 给 出 了 这 个 指令 友 列 的 流水 线 图 。 同 44 季 中 简单 流水 线 化 的 计算 单元 的 流水 线 图 -- 
样 ， 记 个 图 描述 了 每 条 指令 通过 流水 线 各 个 阶段 的 行进 过 程 ， 时 间 是 从 左 往 右 增 大 的 。 上 上 面 一 杀 数 
学 表明 各 个 阶段 发 生 的 时 钟 周期 。 例 如 ， 在 周期 ! 取出 指令 I]， 然 后 它 开始 通过 流水 线 各 个 阶段 ， 
到 周期 5 结 来 时 ， 其 结果 写 入 寄存 器 文件 。 在 周期 2 取出 指令 11， 到 周期 6 Cg, RAHN, 
以 此 类 推 ， 在 晤 下面 ， 我 们 给 出 了 当 周 期 为 5 时 的 流水 线 的 扩展 图 。 此 时 ， 每 个 流水 线 阶 段 中 各 有 
一 条 指令 ， 

从 图 4. 物 中 ,我 们 还 可 以 看 到 我 们 画 处 理 器 的 习惯 是 合理 的 , 这 样 , 指令 是 自 底 向 上 的 流动 的 。 
周期 5 时 的 扩 颖 图 表明 的 流水 线 阶 段 , 到 指 阶段 在 底部 , 写 回 阶 段 在 最 上 面 , 正如 流水 线 硬件 图 (图 
4.39) 表明 的 一 样 。， 如 果 看 看 流水 线 各 个 阶段 中 指令 的 顺序 ， 就 会 发 现 它们 出 现 的 硕 序 与 在 程序 中 
列 出 的 顺 摩 一 样 。 因 为 正常 的 程序 是 从 上 到 直列 出 的 ,我 们 保留 这 种 顺序 ， 让 流水 线 从 下 到 上 进行 。 
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(EHI dA ВЕГЕР, А НР ТН. 


ММ ізін W valid W valE, W мам, ү delE, W dalM 





ІН 


BILIA, aluB 


к 


ЖАГ: 
(EC 





НЕ 4.39 РІРЕ- у 
是 过 性 SEQ. OE A30) PE AGCKAUE В, ЗН ГОТ, АГА А. ЕА SW 
шаи, 
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irm $1, baix hI] 
Error] TI VETE #І2 
irmowl 51. Тейк ali 
irmowl 74, Тек LEE. 
halt k IS 





440 指令 源 通 过 流水 厂 的 示 恒 
Жал 蛤 出 了 一 个 更 详细 的 PIPE-W PERSIUS EIL. ТЕН АЛ-И ЖЕКЕШЕ ЕТЕШ 
(REL PS y fedes BEC So n n oC EFC A. НІ ЛАК ПЕНЕН (BI 
4.21 81 4310 ИШ ЙЯ Zr E deg S PR. ЖЕҢІ hua ЕНЕДИ. 
比较 SEQ IHRER A СЩ 4.30) НІРІРЕ-ІНШӘНЕ (429). Ж{ЇПЖ ИШИ ЕТШШ 
KAEA HL, ИНЖ —defii ЖШ]. ІНШІ, АП а, 


45.2 ЖЕЗІНТЕЙНЛІНІЕ 

SEQ«—iK FLIERE — dede. PELUK valC. srcA 和 valE ЕНІМ ettii. ЖЕ 
IE PP. SPS T ЕЕ И ЖН tS. HERRENA. Иш. E PIPE-DIUATER RIP, 
HIT 53 “емі” Bi e. ЕЛ ЖЕҢНІҢ icode 信号 CLE 44D. RITE 
L Rh uEERIEI E Ed HS EA. Е HFE R, Nin. 4 sli NI RA 
nR Бе Н ЇЇ imp. ERENS ЩИ, ЖЕН ТИН ЕКНІН Ж 
ЖЕ mms nud. НП — hack ЕЖЕН РЕА Б. PIX. ІЛ code f 
ЖА D icode. E icode. M icode IW icode. 我 们 还 需要 引用 某 些 在 一 个 阶段 内 刚刚 计算 
出 素 的 信和 号。 它们 的 病名 是 在 信号 镍 前面 加 上 小 写 的 阶段 者 的 第 一 个 字母 作为 前 纪 ， 抽 如 d sreA 
Kl е Већ. 

SEQ+ 和 PIPE- 的 解码 阶段 部 产生 信号 dstE 和 дам, RBN valE 和 walM Е Е. 
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在 SEQeP, ЖТ НАШЕ НЕН ЖУТ НАПИШИ А. (F РІРЕ- 9, К 
н — nmi А ТТА ФЕ РО, ИИГЕ ПЕПЕ ЗЕН ТЕТЕ (КЕТПЕН 
БЕН». EIE ERA E TuS ЕНЕ ПАН НЕК A Л k Н RES. ТШ. ЖЕТУ 
[ШИИНИН e (ШП А. mrs ID HK B TL TWIN: FII. fr5 B8. STE 
IT РТК ЕК ERE КИРЕТ ТИ BL. 


| 


ые ые — 







шин поп H “m um = шш ma m -m s mz = eR пиги тш DRAN MENS SW 


2 [а Гә | әс FT = T— — 7] 
| | [ Т | [p — | 
| == 


Ha Wi кл NB 


Ж 4.41 Р\РЕ- НЕН, ГЕНУЕ НЕЕ ЕУ 


ЕНГЕН АО ЕЕ, 


РЇРЕ- fj — P 5h E ТЕМА TEAN БЕСА fJ, ЛС ДЕВ PERE "Select A" 


274 кай | | 
=... E EN 

Mik. ЯПАН. xx e de ЕН ИАЖ ЖҮГІ 的 үзір BEU RET B EE A 端口 中 读 出 的 值 
ФЕ fika kiku fra ІНІҢ vala 包括 这 个 扫 是 为 T bm ШЕ ЖЕКИ E ШМ 
TAKE SEM. CATRE Фе, АЖ сай 在 访 存 阶段 需要 wa 的 值 ， 只 ТЕНТИ ДЕФА ЕТЕ Cs 
Rip Н) 需要 valP FH. ПАН ЕЕЕ AW BYP ЖИТ. iS] 
并 这 两 个 情 号 ， 特 它们 作为 信号 vala ЕРЕ АКШ. 及 而 可 以 减少 流水 总 寄存 器 的 状态 数量 。 这 
ИЧИЛЕ Т SEQ CÍ 4,21) 和 SEQ CIE 4.30 中 标号 为 “ран” ИЙ. VÀ КЕНІН Жу 
ІЗДЕ. ҮН, REETA ui БИЕ ЕЩЕ]. ЕТНА Ebr AKA 
кН, RR An. 


453 预测 下 一 个 PC 

ЕЕ PIPE- 设 计 中 ， 我 们 采取 了 一 些 措施 来 正 确 处 型 控 制 相关。 我 们 流水 线 化 的 设计 的 目的 就 旦 
HARE AMAA A (issue) 条 新 指 地 ， 也 就 是 说 每 个 时 钟 周期 都 有 一 条 新 指 他 进入 搞 行 阶段 并 
坚 径 完 故 ， 要 是 达到 这 个 目的 也 就 意 本 着 吞吐 量 是 生 个 时 钟 周期 一 条 指 杰 。 为 了 达到 这 小 目 的 ， 息 
们 必需 在 取出 当前 指 寺 之 局 ， 马 上 确定 下 一 条 指 地 的 位 置 ， 不 率 的 是 ， 如 果 取 出 的 指 专 是 莹 件 分 过 
71%. HRULTNGS, E EA EARRA, RILTÉERUBHE ЕНЕ. ЖЫН, 
XE HL EIE S E ren SERRE VE rr, АЕ ЗЕ DL b hb. 

ЕЖЕН GR ret 这 些 例 外 ， 根 据 取 指 阶段 中 计算 的 信息 ， 我 们 能 名 页 定 下 一 莹 指 坊 的 
АШ. А call 和 jmp《【 无 条 件 转移 ) 来 说 ， 下 一 条 指令 的 地 址 是 指令 中 的 常 要 字 ас, ЕН 
他 指 他 率 说 就 是 waIP， 因 此 ， 通 过 预测 PC 的 下 一 个 值 ， 在 天 密 数 情况 下 ， 我 们 能 达到 每 未 时 十 国 
HRH- ARR NH. MAER Ae, RITE BOISE e ROS. EIER GS. 
HNR GRAMER T yk. ЖАН PC 值 应 为 salC， 也 可 以 预测 没有 选择 分 去 ， 于 和 新 PC INE 
为 valP。 无 论 在 哪 种 情况 中 ， 我 们 者 必须 以 某 种 方 起 来 处 理 我 们 预 铀 错误 的 情 品 ， 困 为 此 时 我 们 已 
型 到 出 并 部 分 执行 了 鲁 浊 的 指 专 。 我 们 会 在 49 节 中 再 讨论 这 让 问题 。 

ЕЛ Еа тае ПИЧ ТЕТТЕ" 
ЗЕ, ГРЕЕ EA ЕЕ ТЕЕ]. ЕРТ k 
ЖИН ЖЕДЕ. ERINE. RETAANE, ЖЕ ЕД НЕЕ T PED E, 
因而 预测 PC 的 新 值 为 wC， 

ЯЗ. Wii ERIUM EK 

ARITA Ж.Ж АЛЕ (always taken] А МаН Ф, inc dog Nodo pi xi 9 
WWL REL, ЖА (Cnevertaken, NT) Kbps X Md) ans. — HEX Ih. 
клан. Eh TRAH (backward taken, forward not-taken, BTFNT ) fj. d iR 
ГНАТА, 4 мызын, Илика АШТ. ARTAR 
ЖЕР 65%. 这 种 政 进 是 源 自 这 样 一 个 事实 ; RUE RE HEAri tk жїн Ee 
FER. қатан ТЫНЫҚ, о еген... ЕЖЕН 439 和 440 F. Шы 
Y86 AEAEE REA NT 和 BTENT ç k ia K w. | 

FRAAS РЕЯ 3E PHDERLIEE ET ЖР Ж. 


RIER HE ret 指令 的 新 PC 值 没有 讨论 , ЕЖЕ ЖЫ. 此 时 пў (ЕТЕН Л.“ ЖОЛЫ. 
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Ei Poen ky РУНЕТА ЗЕ. КИНГ НЕЕ, ӘПЕР. RIAU SHE E hH 
ИЕГИ. КПА. КИ га 指令 通 过 写 回 阶段 。 在 4.5.9 节 中 ， 我 们 将 
回 过 来 讨论 这 部 分 的 实现 ， 


ОЕ. НЕНА ОНША 

Ad ventres РЕОН ЖУДАА аа АРНО 
йл кюл, диел тада, АНФАЛ AAA. È 
Ж & ЖЯ аА, ЖАНАДА Н. АЕ шан UR АФ, SN 
kA, WAQ PH ЕЕН. EX HERR. Br HMM. ФЕ 
Aa RI ERA, em ft. айналуы. x 
TERRA KAKA ЖЖ. | 


PIPE-IGIRGREEER. 008 441 КЕЛ. POBT PC HR. Ú S 33823 D HEUS RE 
标的 PC， 我 们 可 以 看 到 ， 标 号 为 “Fredict PC. (КІН РС)" 的 块 会 从 PC 增加 器 Cincrementer) 计算 
出 的 walP 和 地 出 的 指令 中 得 到 的 тас 中 进行 选择 。 这 沾 慎 生存 放 在 流水 线 寄存 器 ЕФ, ЕВЕ 
ЖЕРЕ. БӨЛ "Select PC (ҰН РС)” fissi T SEO+ 的 PC 选择 阶段 中 标号 为 "pc" 
MR (Шз). БАЗ ЧЕФАН- КЕЛЕ ІШЕТІН ШЕШ РС, ATTAR ЖЕНЕ 
ЖЕН vaP 的 值 (iki p plik ЖИИ M. ЯН чар ATACAREA M, valA 中 )， 或 是 当 
ret {УЕ КЕРЕ W СТРАТЕ W мам) 时 的 返回 地 址 的 值 ， 

SRNIE 4.5.9 їзє ЖЕНИШ. deii [GI ЖЧ RR РЕ 9). 


454 ЖЕЕ (hazard) 

我 们 的 РЇРЕ-Ж 8 R — Rok HL Ye ӘМИН. ЖЫ, А FR 444 
МИТЕГЕ, HEHDKERBOK LA — 45 a OO Rec cn de e eR EIE HERE НЫШ. dex 
КОПИИ W. ФИНАЛ ЫШ. ХЕЕЕ Ед. Dë HX, F BR НВА 
一 条 指 专 计算 出 的 结果 : DRAR. AR ENE- RN НІК, AEA. АЙ 
或 返回 指令 时 。 这 些 相 藉 可 能 会 导 致 流水 贱 产 生计 算 模 误 ， 称 为 冒险 。 同 相 闫 一样 ， 冒 险 也 可 以 从 
HP. SÑ RE (data hazard) #19 W Mr. (control hazardy。 在 本 节 中 ， 我 们 关心 的 是 数据 冒险 ， 
我 们 盒 兰 控制 冒险 作为 整个 流水 吉 控 制 的 一 部 向 加 以 讨论 (4,59 节 )， 

FH 4.42 描述 的 是 PIPE- 处 理 峰 处 理 称 为 prog] P048 A ЕЛИНЕ ДЕНЕШ 10 和 3 放大 程 
IER Бей. HlGeax, Ң4Т- $ nop 指令 , 扰 后 将 寄存 器 各 edx Mitea. 我 们 重点 关注 两 条 irmovl 
指 党 和 addi 指 付 之 间 的 数据 相关 可 能 造成 的 数据 冒险 。 在 图 的 右边 ,我 们 内 出 了 这 个 指 地 序列 的 沾 
水 号 图 ,在 这 个 流 永 厂 图 中 突出 显示 了 周期 5 和 7 的 流 术 戌 阶段。 流水线 图 的 下 面 是 周期 中 写 固 
酒 本 和 周期 了 中 解码 活动 的 详细 说 明 。 在 周期 7 开始 以 后 ， 两 条 irmovl 部 已 经 通过 写 回 阶 段 ， 所 书 
闪存 册立 件 保存 着 更 新 过 的 骂 edx Mear 的 值 ， 固 此， 当 addl 指 专 在 周期 7 了 好过 解码 阶段 时 ， 它 是 
"ГЕ ЖЕКШЕН. 在 此 示例 中 ， 两 条 imovl 指令 和 adai 指 付 之 间 的 数据 相 美 没有 造成 
数据 冒险 ， 

ЕТІ ро 通过 流水 线 并 得 到 正确 的 早 果 ， 因 为 三 条 nop 指令 在 有 数据 相 美 的 指 信 之 间 创 
遭 了 一 些 延 退 。 让 我 们 来 看 看 如 果 去 掉 这 些 пор ЕВНА. Мал 描述 的 是 一 个 叫做 prog? 
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ЕРЕН ЖЕНЕ, ТЕҢ ЖЕЕ ЖЕШ tedy Hear 值 的 irmavl ОСЗ ОНЕ НЕ 
ШІК addl Ji 2 fü fT IR nop f. ЕНЕР, ARRS EENE 6. 此 时 ай fF M W Hr 
SX Phiwi ti k g. БШЕК НЇП БАДЕН AL ER i P ERRARE. 第 一 个 irmovl JB 
БЕШИ T ЕИ. DIUERUTGE(PNEGeh ПЕТР Т. 在 该 周期 内 ， 第 二 
个 irmovl 指 学 坚 于 写 回 阶 段 ， 因 此 对 程序 寄存 器 受 eax 的 写 要 到 周期 7 Жі, Poh ЕТІҢ, 4239 
生 。 周 果 ， 会 读 出 %eax 的 惜 误 值 【 在 此 我 们 但 设 所 有 的 客 存 攻 的 初始 慎 为 0， ES Aper sr И EP 
TERRE. ТИНЕ, ЕТЕК НЕЕ АЕТ А ЕРЕ WR. 


B praogi 1 2 
йшй: irmcwl $10, вік | 
бий04: ігтеті 651.%ғақ 
üxüde: вер 
üxüdd: пор 
бкійа: nog 
ОхП04) addl Wedx, аах 


Dxülli haic 





>: E Е. EN 
VALA 4— R[vadix] = 10 
vali + Riveax] = 3 


= елш А ы = 





| 442 роста ныт. HRK OR ELIO 
ЖШ 6p. W T imod B9 ED Bean. aka БЗ Т ЖЕНЕ, BE ЖЕЕП Жейк Pean FILE WEITE. 


图 4.44 85 HL IF] J 5 rimovl 指令 和 add 指 仿 之 间 只 有 一 条 nop ЕР, 即 为 程序 prog3 Bj, 发生 的 
情况 ， 现 在 我 们 局 区 检查 周期 5 ЖЕ DOT. ШЕН ШІН ЕН B. PEHE ха 
жетейік 的 写 仍 处 在 写 回 阶段 ， 而 对 寄存 器 名 eax ШЖК ЕИ. ІНІН, айй Hi m RIP 
TA IER 

Б 4,45 给 出 的 ЕЗГІ irmovl 指令 和 add {Н ФБ пор ffi. ІШІНЕ prog |Ң, Ж 
生 的 情况 ,现在 我 们 必须 检查 周期 4 ANKARIA, HER add pisi WP. REHE, wl 
өніміне 的 写 情 处 在 访 存 阶 段 ， 而 执行 阶段 正在 计算 寄存 区 锡 eax 的 新 信 。 因 此 ，addl thi Л 
个 操作 数 者 是 不 正确 的 ， 

这 些 合子 说 明 ， 如 时 一 条 指 专 的 揭 作 数 被 它 前 面 三 灯 指 专 中 HEE- ри АД, Пен! 


ИШИН AP Be ЁН 177 
ШШШ. ¿Br Ha ae Е. ЕН АДЕП Ж ЖИЕ AERE ЕН НЫН А re HE Т 
{ЛОН АНЕ. mEs-—TANELE. fth REI. Audet mH ra d 
ax. 


"Á proga 

Пх000: irmcvi $10.Wedx 
üxüd(h; irmcvi Ji, tez 
йкййп nop 

üxdüdi пар 

Пк00е! add] жейм, баля 


üwanlü: halt 





valh + Rivas] = 10 L7 WEN 
valB += R[veax] m 9 





4.41 pog? 的 流水 三 化 的 换行， 没有 特殊 的 流水 二 特制 

ARNM AHH. HEE Я Ф, TA a LLLA) Prop ЖИР cg T 
яй. TERETERE 

I-AR E Siki AEA Ж da. (TIEN ЕН, Pp k 3k 5 dE 
HAGAE. а. AARRE Е. Táitédkddkab5unWEeTEs. 

ЯАҒАБ ANCEN D EOPNET, Ши ЕЛАК УКЕ ЕНЕ Ж ЖЕК. 
қаны, Батар ü Tik bm TAE HAIRA. 

EHA: БАТНИ, ETER (ЖИ) Tiki СН HUBS, НЕ 
і AREN, КЕ HEC ES CE НИТ. Wu tA NE. 

程序 计数 器 : Fare ip Br MF PATRATE. Bader ld e АИ EN 
РФИ, ramo Dd Bed d M. doe P ЕҤ. HERE e ін 
KEHA, k Ë 4593 фе. 

AMEB: ACE BER ERE t ААН, АЕН iki ЛК ЕЩ. 
W RHS ҚАНА ALEAR RAT. Яғ, ДАМИТЕ И Е НЕЬ 
APER РЕМ ӘЛ +, HAB peRGSMd4EGEMEEZBE-—LILAUuYM. nA b AMA 
35 ( self-modifying code) £j + bk CR, Aud ad ap. ФЕ ДНА р, X 
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EEL RERE. ЖЕ БЕЛИ Bebe e ODER ERE, Ad Кыл АННАН 


жя йи B АНАА. ЭТИ, ACER A ВЯ. 
iab gr kul R Ж Aet p A EK W ici ЫН. 


W prog 1 z 3 4 5 ñ 1 
JxU99: ішеуі 510, bady 
TxÜOR; іттеуі 951 kan 
укіс: пер 
ЭЧ: mddl peda, TESK 
üxoüT: halt 





Жам рооза тат, аита 





EMRS. addl АРТА ЕНЕҢ, ЧЕ Шейх (EUH Е ТАТРЕ, А Е ТЕ сах ES EE EPIRI, 


ДЕЕ Е ныл Fo уша НЕТИ АШ. 
455 用 暂停 staling) 来 避免 数据 冒险 


ЕЗ (stalling) 是 一 穆 常 用 的 用 来 避免 由 阶 的 技术 。 暂 个 时 ， 处 理 跨 公 停止 流水 线 中 一 条 或 名 
КЕ» 直到 置 障 杀 忻 不 再 满足 。 只 要 一 条 指 专 的 源 操作 数 会 梓 洲 水 贱 后 面 菜 个 阶段 中 的 措 令 产 生 ， 
由 理 器 就 会 通过 社 指 手球 曾 在 解码 阶段 来 避免 数据 冒险 , 图 446 (prog2). ЇН 4.47 (мор3) 和 图 448 
(prog) 就 说 明了 这 项 技术 ， 当 指令 кш ЕР РОТ ДЕУ, РТ УВЕ АТ. ШТУ 
回 阶 段 中 至 少 有 一 条 指令 使 更 新 寄存 器 Weds 或 %eax。 处 理由 不 会 让 addl R$ Н ЕКЕНИНЕ ЖОШ 
过 这 个 阶段 ， 面 是 会 暂停 指 他， 特 它 阻 塞 在 明码 防 段 ， 时 间 坟 一 个 周期 【对 pog? XO. ЗІН 
【对 prog3 来 说 ) 或 者 甚至 于 三 个 周期 【对 prog4 KR), HARR TEETER., add f$ ERE 


全 在 周期 了 中 香 到 两 个 源 损 作 数 的 正确 值 ， 伏 后 她 续 治 首 访 水 线 进 行 下 去 。 
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E progi 
Tapii ire] SED. ейн 
DxGD&: irai 81. ак 
Пкббе: aádl kedx, tax 
Пидфе: halt 





图 4.45 prog4 КЫНАТ. JARANA KAEH 


СЕЛА 4. addi She Up rB Pr ELI ЕЁ. ҚҰТТЫ ETE ЖЕТШГЕН И. ЖАКИН Fu W A ax. if E 
Qo ЖИЕ ada 和 valB {ЕЕ МИЙ. 


4 progi 
Dx uno : 
FAITE: 
Съ 4 


за. 


бкййес 
Külü: 


іттызгі 510, teiz 


тты 941, kan 





446 prog? me R V rn dece ce n ur 


4, m6 TH ada HELD C. WWE MS AW — REMIS. RB ЧЫИ tw r а теп 来 遂行 的 写 造成 的 , ë 
ИТИЙГЕ А pA. JETER? FW S HE aad] WWP. ЧЕ), EUR SEHR Жыр т. ШИША 
PUSH T prog] ІНЕ (RI 4.422. 


F adl IR ИЕ Е GB IT И]. RU TE АКЕЛ И s ЇЙ һан НЕЕ ЖЕЛДЕН. ЖЫ 
译 计数 器 保持 不 变 就 能 做 到 这 一 点 ， 这 样 一 来 ， 会 不 断 地 对 halt 指令 进行 取 指 ， 直 到 暂停 结束 。 
EARRA EAR ERS IEEE ELE BE, ІП fer MAR I ІІІ А. EROTA 
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фр, ӨТІН add ІБЖ. iE halt FREUE ТЕ ЗЕРТ РА. FERE 1 一 3 ТУЕНА А Д, TÑ 
ІНІН Ж immovl HALLA nop fit СЕ prog? 和 proga 情况 中 ) НЕА Ат. ШЕШЕГЕ. H 
2, ЖШШЕ КЕЖЕ КЫ add] lh ir THE A HE? ПИДАШ. W 
WARR EREEREER., So ESTEE BLA — (M (bubble). 气泡 就 像 一 个 动态 产 
ЕШ nop Jf —— Ë exp rR. ИНЕ E Hs ЕЕ НИСЕ. (ЕН 4:46 8 4.48 ТИС 8 
"hee іг, Еа ЕР, АНА add 指 对 的 标号 为 “已 ”的 方 框 刘 标号 为 “ 巨 的 万 
НЕ f] P M o e PW KS TN. 这 些 第 未 表明 , 在 执行 阶段 中 插入 气 泄 是 为 了 侠 代 addi fri, 
© Ж PEiRER EE ADIRE E ААТ. dE 459 19, ЖИП B| K КЕЕШ АЕ А. АНШЫ 
ШЫ. 


F pregi 
gaggi іттеті 510, Бабы 
ails: іттеті 651,%ғах 
ШЕШЕП: nop 

Babhla 

Þabblë 
UxODd: addl імік Фея 





Fag halt 


图 447 prog3 的 性 用 逢 迟 的 流 来 线 化 的 执行 
ЕНЕ 3 rb] аш ін, CEREREM Т TR ST SI W ИЮ. ЕЧЕИ А Uq. ЭНЕМ 
Шен иш! ЧЕ. G ЗШЕ ИЙ аз ПИШ. CECI R PYM PUBL. ЭНЕНІ7 ЖИ УН 
^k addi (MEA, ER E. BL ERE HE D ЛИ Ж пор 8, НЕНАТАЯЫҒ рге! ҮЙ (B 442). 
8 progi 
(xDDD: irmowi 510, Теніз 


Gxü0b: irmew. 53, EAN 


ПжПбг) addi kød, Tmar 


ПП: hile 





8448 рос ЕНЕН CK De uy 
ERA pH adl SEL S. ЖЕКИ ЕТ HERCHAERETEIEA IEEE. АНЕЛ AT. FN 
8 3 ТЕНЕУ addi ҮЙ}. КИЕН TS ir BN. ЕАГИ. Кн, ЖЕМЕ RW ik 
f adl IU US, ЕШКИМ ЕКЕЖ НЕ, ҚРАНЫНЫА- ҮШ. H GB PB MU add БИН. 
ЖЕ. ИНИЛАЬНМА- Ж nop t. ШЮПНАК ЖЕШЕТ pogl Er CE 442). 


ЕНЕН ЖЕТЕН ШЕР. ЖЕШ ӘБИ ЕНІ progl 流 (H 442) —РЕ ЖЕ 
流 ， 有 效 地 执行 了 程序 pragz、prog3 和 propt. A prog? 插入 一 个 气 光 ， 为 prog3 SR ALT "GR. М 


кта É H 30 I 28! 


progd MASTAA БЕ Ж— Жіптен fB I add 指 信之 间 有 三 条 nop fi. АНАТ SRK R. M 
"ERE Sob E (SFREE 4360, (CUETIBIE ERR. —d4990m—TW 
TE ЖИПЕК ТИН ФЕ t UH Er Eb. nx HE UR PERO, ШЕЖЕ ЕК 
u= F BHI. FERETE F Ot Ж. 


456 用 转发 【forwarding) 来 避免 数据 冒险 
我 们 РЇРЕ-Й И R ЕЕ АВТ И M W ИН ТЕРЕ АНМЕН. ET eR a ЛК А 
REF KEMST. БЕШЕНЕ. ШШЕ АЖЕ ЕНШЕ ЭЖ HC FERE 作为 
WEE. 449 用 prog? AW 6 ШКЕ Pe B T а. ИЕЛЕНЕ, 
A TF вах TEMERE хан 的 源 寄存 器 , 而 在 写 端口 E 上 还 有 一 个 对 吕 eax 的 未 进行 的 写 。 ЫН Ж 
单 地 将 提供 到 端口 E IPS (188% ал ТІННЕН valB Poll, бірнант. ініне 
值 直接 从 一 个 流水 战 阶 段 传 到 较 早 阶段 的 技术 称 为 孝 据 转 砾 【data forwarding. ЕМЕН XO. VIR 
得 prog2 的 指 信 能 通过 度 未 线 而 不 需 椰 任 何 暂 停 ， 
i pragi ! z 3 4 E Ë 了 8 B ii} 
йип 1ге] FLD, keis 
Шай! ire] 3$, Wax 
dadir mop 
PUDE: mp 
bine: ші ісік biir 
50010: hal: 





ҰША 4- Fijvesis] = 10 
wal #— W valE = 3 


4.49 prog? ЕННЕ KG (ET 
(t NBI, ЖЕНЕН НЕЗ ТЕР Deas kitimi. CHIK, ИЕШЕ ikhaq, 
DELLI 


BB 4.50 ЖИЕНИ. "hus ERE НГ RETE BE ETT EH. ШШЕН КН. DL Ae 
程序 рторз 中 的 暂停 .在 周期 5 cp. ИШИНЕ ЩИ. ҮКЕНЕП E E PETER ік 
来 进行 的 配 ， 以 及 在 访 存 阶段 中 有 会 在 山口 E БЖҒ “ах 未 进行 的 写 。 它 不 会 暂停 直 到 这 些 
写真 正 发 生 ， 面 是 用 写 回 阶 段 中 的 值 (信号 W уШЕ) ЖЗШ va. ӘНІНЕН {信号 
M, valE? ФЕРЕ valB. 

AffSERERSHEHBE, ВТЕ uUi BE Ho LM dut ERES SUMMER, UE b 
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程序 pmog4 ВГ ЧЕ. Наз Rp. RN 4 h, AGREE NENA ТЕ ВИЗА ЫТ 
Beed 未 进行 的 写 ,而且 执行 阶段 中 АШ iE DEI REI) (ER I YI N S ғақ. ТЕГШ {Р 
阶段 中 的 值 (信和 号 M. valE E ЕНЕ ВЕ vala, 也 可 以 将 ALU 的 输出 (信号 с ШЕТЕН val B. 
注意 ， 使 用 ALU WIS ЖЕН НЕН. MEREEER Н ЖЕНЕН ШЕК n d ETN walA 
НІ valB, ТАР ЕНЕ ЕНЕ F— PINE, ЕГЕ E AE Ak ARON ИЕТ. mtr 
Же ALU FA OR RENT. 

и prog) 1 а 3 4 8 & 7 h 8 

Пя100: irmgvl $12, bedk | 

Пий тген] £3, Мак 

mie: тар 

DxJOd: әйгі! iade, Ranu 


ке halt 


W ӘНЕ = жік В[ї»ах| + 10 


W_w8lE = 10 





Ш45) prog3 ВН ЖАЧА 
сын 5 h, WERDE EAA ТЕТИНИН dl Ip Beds GITE. ШОЛ Eu TB HIE TEE IET ETT. 
ENIRO. mda E Fer EA valA 和 тан EL. 

FE HF prog2— progá ТИНЕ Erb НЕНИ ЕН ALU ЕШШ ЖК ПИ Ou SS E 的 值 进 
ТИЕ, 其实 也 可 己 转 恬 从 存储 器 中 读 出 的 以 及 其 目标 为 写 端 口 M 的 值 ， 从 访 存 阶段 ， 发 们 可 以 转 
ҮНІНЕН ЕНТ Е Н НА A т маім). MSARNS. ПЛАН ЖАНЫП М 未 进行 的 
ЧОН W уам „ЖК ЖАҢА T ASE] IPP Же у Е т valM.M valE.W valM 和 valE?, 
EL EB АМЫН ЕНІН (ұША 和 val B2. 

图 本物 一 图 #31 ih I Pi e UAE ITE И Fe EE Rc W Hr C PED UL, 还 是 要 用 转发 
S Xp. bp bi eI re TC ERI CLERC RE НЕН Ж ID, 38 8 BeOS ID ӘНІ ID 
acA 和 В HER, DOOR RIKI KT. ПНЕ ТИЮ ID 5—T ID 相等 。 E 
WEBS, RISA ЖТР ИЕ ЖИ КЖ. EFIR REREH. & 
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ПЕНЗА, 
8 progi 
Üxb0D: irmevi 610, ed» 
ÜxoD&: irmovl 83. авая 
Üxóüz: add] iedx,Yeax 
йи®бе: halt 


Ж 
а valEs-Q + 3=3 | 





НЕ 451 Pro34 的 使 用 竺 发 的 流水 线 化 的 执行 
ЕМІН 4 h, MEL REIEMEN IW eO TO Rp ИЙ Фе ЖИЕН. ERTAINA КЕНИ Л Ша P 
Wf. наша, ЖИА ЛИТ ИНЕНЩ. PEU ad RI valn НЙ. 


图 452 ETE PIPE 的 抽象 结构 ， 它 是 PIPE-IHà R, ЕЛАН ЗР HER. Януш 
fi £m T Mo ЛО ВЕЛЕ ЕЕЕ CDD Жж). Ini | bypass 
path) БОЈАРА RUP — 5 928. "Forward" |Ң, D Re FL ERO РЕ Е HB ШЫН; 
iX lo TE de PESE vala 和 valB. 

ІҢ 4,53 给 出 了 PIPE 硬件 结构 的 一 个 更 为 译 细 的 说 明 。 和 将 这 帆 图 与 PIPE- ERA] CN 441) 相 
比 ， 我 们 可 以 看 到 来 自 五 个 转 党 源 的 值 反 僻 到 解码 防 段 中 两 让 标号 为 “Sel4Fad А” RI "Fwd B" 的 
HK. d 87g "SelsFwd А” (fele PIPE- 中 标号 为 “Select A" [ШЕШ БЕ SERIE Ar. ЄЛ 
ҮКЕ M 的 vala Ж СОЙ ШИНЕ ШЇ уар, АЕ А ЖП dap. dd 
ИЖ ЧЖЕН. ӘЖ "Fed B" (BE REL EGER IERI valB ТЕЕ. 


45.7 加 载 /使 用 (load/use) 数据 冒险 

H SHE SECRET RERDRM es BEDS HERB IE ЕА UR TE ЕЕ. B| asa 
НИН Te ЧА ЛТ W HE Сіюшілне hazard), Mode (C0 RAE Ox018 的 mrmov АҒ 
ШЕН АР 7 aean НИН, m F— efl (ЕНІ Охоте 的 ма) ЖЕЕ БИЕШ. 
НІН КЕЗЕНИ TORIS 的 扩展 说 明 ，addl 指令 在 周 朋 7 hi E OR НЕШ. (BE mrmovl Hi 
ARMES TERRAE. Ж TM mrmovl “HAR” add, HERETER EAIN 
时 间 ! ЖЕТЕР, ЖП ЕКА АИ Е ЕЕ И Да. AR. стан 
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С [f] irmos] i 9 ЕЛЕ Т ТЕ ех ИҢ. af ELI Up frr ELR ЖЕ H Т kh F RE EP addi 
qi. 


W кїйє, W тайм W val. W val, W desE V dena 


uh гү 


іт 


Wai 


Ham 


Ета 
i PC] 





图 452 АОН X 3 —PIPE 的 抽 莹 图 
КЕШЕНЕ: (НКЕ Жл iÑ HA ЖАПАШ = ына. ЕРНЕП Ж И КН ЕЕЕ ИК. 
атн ORA. 


A 455 ЖЕМЕ, Пай РНН REA Ж. E D UD CE ИЕ. | 
mrmov] {ЙЧ TRE BE. AK ERE FEIER RUM BOR REP 3 (айй) 需要 这 个 从 存 依 器 中 
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| " НЕ 
ГЕ 77” — — I» I [ГБ = ы ЕНЕ 


KHO | m майы 







ЕЕ] 


ВА 


m n—m п -m m шани rm s mm m m És s 


| zm E 


Бае ә [T = P 


ü 


Xi ffi fb r Т. PC 





NEN nn 


图 453 RE EEEURCKER ENPE dt ҰНЫН 
(® ow Fé Ж 
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吐出 的 关 果 。 它 会 特 解 码 防 段 中 的 指 地 暂停 一 个 周期 ， 导 至 执行 阶段 中 揪 关 一 个 气 光 。 友 周期 中 的 
ЗЕ И Г ак. ЖАГЫШ ni cr ELM d fp REEL Ж ИШЕ БР мш! fih. КІРЕ Фейк 
的 值 也 可 以 从 写 回 阶段 转发 到 访 存 防 段 。 就 像 征 未 线 图 中 ， 从 周 央 7 PREN "D" ЕНІНІҢ 
中 标号 为 Е"ИЗЕНИ;ЖЕНЕЕН, МАБЧМНЕТ ЕЖ РАН НЕН 
的 addl 85. 

ë progi 1 203 4 Б ü Т й ü i T 


Пи с! rmmeowl несш, Вейи] 





022212: irweml $15, baba 
биеій) врео] 0 14005), Байк ë Load kasq 
басіа: айй] Walk, sax 4 Ds Pun 
(520: halt 


ЮН 254 ЕЛЕШЕН ИЕ 
аш PEAN TRARNE RAEE сах ПАНА... ІШІН mo Hit ERE 8 КЕТЕР ЕТЕ Ж Rea ПН. Н 
Гада 38 7. 
ДАРИ ЕЕН FR] ИШЕ ЛЕК p L4 Cload interlock). ШИШ ЖЕ 
opa kn ШЕ ti ГЕ iW S. АЕ Н И ER Е ЕНЕ, ТЛ, ЖЕН 
UL 3M f МЕРЕН — 3 9 der ЗЕН ЕНЕ. 


45.8 РІРЕЕМЕНЕН 

更 在 我 们 已 经 创建 了 PIPE СДП НЕ Sik ЖЕ ЖЕНІП vao 处 理 器 》 ӘНЕ, T 
全 用 了 一 组 与 前 面 顾 序 设计 相同 的 硬件 单元 ,另外 增加 了 一 些 流水 线 寄 存 器 .重新 配置 了 的 远 辑 妇 
ВРЕ, ТЕТ, АГА УЕ УАР, ТОЕ Е ТРЕ 
КРАНА. ТРЕ S SEQ 和 БЕСА ААВ Н, ТАА BR READER 
"fra СЕТО ЖЕҢЕ ЛҮП Е А S HEBRRRENE {用 小 写 的 阶段 书 字 的 第 一 
Ге ЗЕРЕ А ПИЗА У 的 信号 中 选择 迁 当 的 值 ， 

作为 一 个 示例 ， 比 较 一 下 SEQ 中 产生 sea DUEB HCL (6835 PIPE 中 相应 的 代 国 。 

й Code from SE 


КИЛЕН 


int FER = | 
icode in { IRRMOVL, IRMMOVL, IOPL, IPÜSHL ) : га: 
icode in T IPOPL, IRET | : RESP: 
1 : RNONE; % Don't need register 


|: 
# Code from РІРЕ 
int new E srcA = | 
D icode in í IRRMOVL, IRMMOVL, IOPL, IPUSHL ] + D rhy 
D ісейе in [ IPOPL, IRET | : RESP: 
l : RNONE; # Don't need register 


Ж pret 1 Ë 1 4 4 ñ T B т 11 tt 
QaDJD- ігесуі 51285. Wim 
Пий: hre] 21 kawa 


Tiigi mmmpel &ecw, ñ [kadhi 






1x52: илт] Ble, kaki 

Emig: meor] Бійшікі taux P Ілес Wax 
Emila 

mlle: кый Һал. нал F Шы Har 

илїї: balt 


M dalli = каз 
m vi «— МЇ12®] = 3 





иша 4— W. МЕ a M 
чадв а m уай = 3 


8455 НЕРЖИЕНЖЕЛЕНШЕ 


287 


3135 add НЫН КИІН, Жей val. BIR Ur FER BEP UE. mmov] fib 54 ВИН BO nif addi f. 


它们 的 不 同 之 处 只 在 于 PIPE MS ЖИК ET ER 0", ШЖ {ТЖ НИЖНЕЕ В. А 
THREE. ЖЕК АШ N SEQ КН Н ЕТ Л ЕКПЕ HCL 代码 ， 不 过 作为 


ӘЖ, HX ATLAS 节 中 列 出 了 PIPE 的 完整 HCL (8. 
PC Hd REPE 


ІН 4.56 提供 了 PIPE БІЗЕЕРНІЗРІН І-ІІ. ШИШИШИ. ДИЕ 
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ФТ ИЛЕП АЛИН, ELATUM F-— РС 0. HT EMO ТЕНЕ STRUCT d ffo Е 000) 
Ийт. Б SEQ hy Ж ШЕ— 08 аза ИННИ ВЕУ. 

PC ЖИН — КЕЛИН ТАР. ИННО Л EHE A TEM, 2 A 
ЖЕЙІТЕМ “信号 M, val? Ф {ЕУ vaP 的 值 【指明 下 一 条 指令 的 地 赴 1。 当 rai Beb N 
БІНЕН, БАЯЖНЯНТЫУМ САЗ W valM) 中 访 出 返回 她 址 ， 其 他 情况 会 使 用 存放 在 流水 
HE FC CS Е oredPC? 的 PC Й. 

int Е pe = | 

ñ Mispredicted branch. Fetch at incremented PC 
M icode == IJXX && !M Већ 1 M vali; 

е Completion of RET instructtàt. 

W icodé == IRET : Ww valM: 

Ё Default: Use predicted value of PC 


|: F predrcC; 





M ende 
M lich 
| | M sii 
| fojan a| e | =c | | vae | | |, 





6454 PIPE 的 PC mast IE TR 
C ТАЙНА И ИН. CRUSHIENINTE Bn. 


"ЩН EHE ФА e CUN FE ШИКЕ, PC ШИШЕ I EP val. ER EER walP; 


int new F ргеарс + | 
FE icode іп [ IJXX, ICALL ] : E valet: 
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1 ; f valP; 
| ғ 
МУ "Instr valid". "Need regids" ЙІ “Need valC" ФЯНАН SEQ PHR Fl ep S 
hos snas. 
Нун 
PH 4,57 ЕНІН РТРЕ ФИГ [ИЕ И I LP iR. БОЛ "ВЫЕ". "дам", “аА "В" 
ы 它们 在 SEQ J rh НИЕ. ЕН, ШИН ТИП ID XBT 


ИН САК W deE 和 WwW дым >. ТОЛЕ РИАЕТ. IX EDITA REIS IRTEN A ЇН 
人 存 器 是 出 写 回 阶段 中 的 指 专 描 定 的 ， 








TRUE ЕШ EX 


Ж 45; PIPE 的 解码 和 写 回 防 自 还 辑 
ТПО U ar УШЕН ТВО А РН. NH ЕШҤШЕ ИЖЕ. ОЦЕ mA. Ku y; 
"SeleFud A" Wira. НЕ val ТИКЕ. ӨЗ Fed B" ОЗА КНЕН Е valB GREEN. 
ЕНИН ЕЕ И Н ЖП ЕДИН EL dA ТИСЕ ТЕ RARI DS OB ТУЙ ЖЕ ЭПТЕ ЕДЕН 
ИН ing e 
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ЕЗ 4.23 

RERE PHT "dab" Fs ЖП АЖА ЕЕЕ р REH Ag ATJ. P k da 
аР. 在 PIPE 的 НСІ. itt, PERLE AF 5 new E дыЕ. 8 SEQ (EE da 的 HCL 描述， 
习 出 这 小 信号 的 HCL Ж. (R4 434 S PAR, 1 


这 个 阶段 的 复杂 性 主要 是 跟 转 发 还 辑 相 其 ， 就 像 前 面 提 到 的 那样 ， 标 号 为 “SelHFwd A" (ik 
HARTA. EARRAN valP ñ AERE va EG. ШШ КЫН К 
BE. CELE ТИМЕ vala Pris, 

ТЎН ҰША 和 valP 庶 用 了 这 样 一 个 事实 ， 那 就 是 只 有 eall ИНЕ НЕШЕДЕ 
valP ІЗІН, Ша А ЕЕН, ЖАРАЛ А 山口 中 读 出 的 值 。 这 站 选择 是 和 该 界 段 的 iode ін 
号 来 控制 的 ， 当 信号 D ieode 与 call 或 jXX НЫНАН ЕН, КЕЙН D valP {ЕЕ 
的 输出 。 

à 4.5.6 节 中 提 到 的 开 样 ， 有 五 个 焉 同 的 转发 淹 ， 每 个 都 有 一 个 数据 字 和 一 让 目的 密 帮 右 ID. 
02. . 
АЛДЕ | 
ШЕНІ 
iñ fig BEP CI E ER FT A 
"SB BEBE м Ж тїї 
Wall W (ШЕ TERAPAN E Xd ti it 


META ЕНЕНЕ ЕК. W Pihak iki d rvalà (ШАДЕН A ТЕШЕН ЕЛЕ 
uL pp 
WERE. ЖИПТЕ ГЕШ АРЕКЕ ЕР E 的 valA 的 新 值 的 НСТ. 描述; 


ІНЕ new E valÀ = | 
D icade in | ICALL, IJXX } ; D уйір; 4 Use incremented PC 
d srcA == F_GatË : e valE; # Forward valE from execute 
d. srcA == M dstM : m valM; 4 Forward valM From memory 
d erch ss М dstE : M valE: й Forward valE from memory 
d srTCÀ == W datM : W valM; 4 Forward valM from write hack 
d Erch zz W dstE : W valE: 4 Forward valE from write hack 
l : d rva;A; # Use value read from register file 

















|; 
Lit HCL ЕРТЕН Ей ОСЕ ЕА Е нт, Е ЖН НСІ. н! SE 
互 个 目的 咨 存 器 In РЕ О. жатан, ууш, WAKE Eum. 
Ш 4.58 S UH T Вр, ЕШ ЖАНТ ЖІЛІГІ ЕРІНЕ ЖЕРІГЕН. 在 这 个 程序 
и, ИНЕНІ сік, m9 4 gx T ТЕНЕ ТАА Е. Jb mov 在 用 
Ш 4 ЭЕ ИНИН. MOREAU SUE RET ИЯ ЯНҒЫН АРЕ. ЕМДЕ 
ЕТ 为 了 设 定 贫 先 级 ， 我 们 必须 考虑 当 一 次 执行 一 条 指 地 里 КЕННЕТІНТА. %-% 
irmovi {ФЕР Фейк 设 为 10, 38 — f irmovl 18538 2 199 3, ЖЕ mov] E 425 Jed 
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PRH 3. ГЕНТ, ПУАТ ЕО SERERE i RI ЕЕЕ ИКЕНЕН RN 
CLER КС АДА, ТААР ВАЕ FPI hik Wik E r ЕНЕН НІН. КИК. КЖ HCL 和 代码 中 的 
ГОО ТНА В, Wi R UTM BEP. ERA E ERa P. 
31 Fl EU) Е ЕРТ МЕ ІШІНЕ ЖЖ. Н рор! Февр 有 影响 ， 因 为 只 有 
这 条 指令 能 同时 写 两 个 寄 看 器， 
й prog 
üxüüd: істеті $12, bede 
Dagi: lrmoyvl 53, ішік 
üxüüc: rrm] Жейк, Меки 


Пяййа: halt 


гоша 3 


图 4.58 转发 优先 级 的 说 明 

ЕНШ 41, еда ПИСЕ ЕГУ АА ULLDGDSUSIITLDDLLMERTITITI: LI DJ ІЗ ГЕНЕ D 
ки W Е 

练习 是 4.24 et 122.) š ia iy Hn 
| 假设 new_E_valA 的 HCL RGP £ к ЕН (RA Br ARR B ЕЖЕ) МАЛЫ 
id, НЕТА moliio (CX 5 H) K ra: 

| irmov]l 55, Vedx 

2 irmovl 950х100, еар 

3 rmmovl &e&dx,ütesnp! 


4 popl *esp 
5 rrmov] esp, ћеах 





练习 是 4.25 y 

Ti new E уал 的 НСІ AGP Hz to cc E UL ( & SuSE T BER) 的 顺序 是 
诛 过 来 的 ， 写 出 一 个 党 运行 错误 的 Y86 程序 .请 描 迹 铺 误 是 好 何 发 本 的 ， 以 区 它 对 程序 行为 的 影 
"й. 
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ӘЛЕ 4.26 
ЖЕР u h B E £02 3 A шін ER. Edi) new E valB 的 HCL fb, 
H ir BEBE 


Н 4,59 属 现 的 是 PIPE 执行 阶段 的 还 辑 。 а ЕА ЛЕ Е Е Е] SEQ 中 的 相同 ， 回 时 对 全 名 
Haitit. Ж ПГ ME SS e valE H E daE {ЕЗЕН ИЙ. НИЕТІ. 


[fe Jen) | we | - | [к мы | 


| Beh 





с =E 
E dut 








Бә an[ | эс [o T <ë (ае әм [әсасә 


4.59 PIPE ДЕНЕШ 

-AHT SEQ i Bo EUER SE E ERI 

ui fé Pt 

图 4.60 dert iE d PIPE КІЛІ, ЖЕН SEQ ӨМІЛІГІТЕ CIL 428) ШИЮ. 我 
ЯН, ЕНІМНІҢ. РТРЕ "Dif; SEQ (is 9 А “Data” ЗЕ. m blh RK H KES 
valP (对 call {Н ЖЇН) 和 val 中 进行 选择 的 ， 但 是 这 个 选择 再 在 是 由 解码 阶段 中 标号 为 “Sel+Fwd 
上 ”的 块 来 执行 的 。 这 个 阶段 中 的 其 他 块 者 和 号 总 中 相应 的 部 件 相同 ， 辐 时 对 人 悄 导 做 适当 的 重合 名 。 
(Наз, Baba ELA BUE WDKSR E PESE. EL M NW KH MW Fc KQ ENS AI 
B — tr. ЕЕЕ ҚМ, 


45.9 Ж ЖЕТШЕ 

НЕ ded p e Eo uL АНЫ ЩН, Яна PIPE Bir T. Н AAN ЕШ < 
Petits. ШЫНЫ CPNADIN REOR Riy HUND FALL RUF EEG 

处 理 ret: LUKE HUE PS FORI ret 指令 到 达 写 回 阶 段 ， 

加 载 /使 用 贸 险 ， 在 一 条 从 存储 器 中 读 出 一 个 值 的 指 伟 和 一 条 使 用 该 值 的 指 坟 之 间 ， 泪 水 斌 必须 
ВМ. 

ЕЕЕ ч Ее ПЕТА РСЕ A ERA 
Г. GANNA PERRE, 

Tir] eil paiay ISI. Е a ae A RIO P PANE. 


к= бю __293 


W poda = 


RIETI Гн Dep] 





TEREN Z T = EER 


图 4 如 PIPE 的 访 存 阶段 还 辑 
шала M A Ww GUSTA НЙН Л. ШКЕ. eic CLERI AL. 
特殊 控制 情况 所 其 望 的 处 悍 
利于 ret 指 人 学， 注 放 上 下面 的 科 司 程 序 ， 这 个 程序 是 用 汇 庙 代码 表示 的 ， 左 边 是 香 个 指令 的 地 址 ， 
dg. 


ÜxDD 1 irmovl Stack, Февр й Intialize stack pointer 
silh.: call proc й Pracedure call 


ÜxÜüüb: iemovl 51D,&edx & Return point 
0х011: halt 
0хҡ020: „ров (х20 


OxD2D: Drac; 

бхӣ20: ret & proc: 

Üx0211 rrmovl Wedx,Webx W Hot executed 

бх030: .pos üUüxib 

0х010; Stack; & Stack: Stack pointer 


图 4.51 SH [ 8413603880 KER MI ЖЕН rer TR. ERR CAKE En T 
RENES. НДЕ Ac Ай. БШШ EIER RE. IR ЖШШЕ НЕЕ ӘН 
АНЕ, RIBA P Sq HEB. ATERAT. ЖИН HHE 
MIETE ETHER bi. 

mE 4.61 所 示 ， 周 期 3 中 取出 те 2, RRE ER T ASEME ЕЕЕ 
BMW. AITAB, ЖЖ ЛЕБИ НІНІ, RTI t W KS A = t. 
-H met PUES [АЕ Е, PERRERA GARR Nis ІНІ. ҚБАРИ Ae EH 
ЗІН Ob 000b) 处 的 inmovl fi. 

Н 4,62 Sit PI ЕНЕР ret PERRA. КЕЕ ТЕГШ PI, НЫН 
НЕЕ ТЕА. ^Ш. SMB, ЗЕТ ВЕ А НЕБА ЕН IR. O ass ЗСК 
PC МЖП НИ НСІ. 代码 ， 我 们 可 以 看 到 ， 对 er 2 KR, РС РОТЕ Е valP 的 ， 也 就 是 下 
-村 指 他 的 地 址 。 在 我 们 的 示例 程 序 中 ， 会 是 Da021， 即 ret БІ mmovl ӘНІНДІ. SX fT 
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Kik. АИИ ERES. Е НА ЖАР, BR р, BEERE ДИР 
BS IER IRURE. ЖЕТА Е УНГЕ А АД, ТЕПКЕН mmos 指令 ， 但 是 在 解码 阶段 就 
Eu ТМ, Fa BE 4.62 ЧЕ А ТЕ), - ЕНТІГІН, бе 
ИЯ КНИЖКА. Жіп, ЖТ ДН movl 指令 。 СЕВЕ 4.62 BUE 4.61. ПШ, R 
BAT TWISTER, ПАПЕН = + WW T АЕ. 

8 prag? ! 2 3 а ñ G 7 8 8 m n 

бхр irmovl Stack, ен Е [о [е [м [м | 

üxDD&: call реве 

bubble 


buhbls 







huhbie 


oxüüb: іскіуі $10, bedz £ Return point 


Шіл! ret ТЕ Ва 
Қоға ЧИР. Pp MU HEHEIRIH. КЕ И. ЖЕНШ А PUB. —U a RR lb SEQ (ОЙ Т), 
PC IETEIEMERE T; PEU RH HE UTER GE 
E prag? 1 š 1 4 5 | B T B 8 10 11 
DxüDD; ireny] Btmsck, edu 
üxübÉ: call реге 
0и020: тағ 
03921! rrmov] Wedw, Veba W Mor елесіне 
Punku l m 
üxi21: тутот Wada, бал F Mot executed 
bubble 
Ткі2іІ: rrmov] Wed, аси d Mor sxecurüd 
buhbla 


Gxidb: irmovi $1b,*edr # Return point 


Н4.42 ге! ИНЕ 
FREIE PD ЧН re Ñi ТИ] muosl 14-9, (1 Ж ЖЕЕ IE VERE hina (ЖШ. ЖІ петти РЕЗЕ F+. 
HIHI IM ЖЭ GEB 361 Hrs. 


(4.57 Tip. Ref pte RIA T Insti BOTTES ( loadfuse hazard) Ir B] i joi ok ee Hed, ШІН ass 
Қа», ӘҢ mmovi RI pop 指 过 会 内存 储 器 中 读数 据 ， 当 这 两 条 指令 中 的 一 条 处 于 执行 阶 掺 ， 而 雷 
至 项 目的 寄 症 品 的 指 信 正 处 在 解码 阶段 时 ， 乳 们 要 将 第 二 条 指令 阻塞 在 解 回 阶 和 让， 并 在 下 一 个 周期 
和 住 执行 阶段 中 二 六 一 个 气泡 ， 此 司 ， 转 发 还 加 全 解决 这 个 数 虹 置 隐 ， 可 以 通过 将 流 杯 线 寄 存 路 D 保 
竺 为 阁 定 恩 意 ， 从 而 和 将 一 个 指 他 阻塞 在 解码 阶段 ， 与 此 同时 ， 还 必 频 将 流 未 战 寄存 器 下 保持 为 国定 
状态 ,这样 一 来 ， 就 会 第 二 遍 厂 出 下 一 条 指 乞 。 总 之 ， 实 现 这 站 流水 线 流 需要 发 现 冒 险 条 件 (hazard 
condition), {КАЖ Ж 88 F RID [Su T, НЕТИ ТЕ X CL. 


ALIE а Rk Q 29% 


ТТЕ ERIRE ГЕШ RC ACRI ЕКШЕ. ЖШШЕ ТЫН) 
ik, Dic Ж. 


DxÜülb + ногі &eax, €*eax 


üxüllz t jne target à Not taken 
Dx007 : irmovl 51, *eax й Fall through 


Ож: — halt 
üxdDe: target: 


Оз 0 : irmovl 52, bedk # Target 
0х014: irmovl $3, t*ebx й Target] 


üxDla: halt 


图 463 AE ЖЩ ab RUE RA 3. FUITE ERRETA CERIS PU HU. 
їй АЖЕ КЕ (ПЕ Ж ЕВ ЇЧ. HAMARRE ЕНЕ Ж. RUNE 3 ФЕШІНІ TRE 
转 目标 处 的 指令 ， 而 周期 РЕНИН ШІН HENE R. EN A. SW KMA ERE) 
ХОН. СОН T Edu. ТАЕНЕ Г. Жай. ДИННИН НИНИ 
пр Ride. HH MTS ALATE p ЧЕ RR. EATE., dp RU 
Huy. BIFEdEF—TRIBITEMELRBUTHERET А POR. JETER USER HR КИШ (d. 
和 这样 就 能 取消 一 一 有 时 也 称 为 指 信 排除 gushing) —— EARMA AENA. Е, HE 
预测 错误 的 指令 就 会 从 流水 线 中 消失 。 

Ë prog 1 2 J а б B 7 " ù м 

Пх001: zorl bear, ах 

Duti: jne target й Nst rakan 
й ба: irmovl 52,%тнік # Target 


Bukh а 






üxü14: ігтеуі $1,%ейх # Targetti 
Бш 

бж007; irmcvl 92,4шіх Ж Fail through 

сжйіні) Halil 


E453 ERAAN Et 

KORIRA AAE, ТШЕК Н БАЕФ. E 4 A. сия TREE. ЖН. AA E 
EART. EAAS ERRAR Ч. BS TEENS ПНЕ ЕЕЕ А, 

кү 

图 464 ЮТ ЖЕКА КАКЕН AE PE. ҮНІ НСІ. KUL BRE ТЕНЕ FIF F 2 HUM 
=н... —Ж И КНН ТЕШИ ТИШНЕ. TERREI E FÁA AA 
Мажа, НІНЕН Шен, CL [LM LS 
WEE D. E 和 M 分 别 保 持 着 处 于 解码 , utr EIER PER Re rd. 在 到 达 时 钟 周期 来 尾 时 ， 
信和 号 d_srcA 和 d arcb 会 机 设置 为 解码 阶段 中 措 全 的 源 拖 作 数 的 寄存 器 ID. ` ren h 389 kiq 
时 ， 要 扯 发 现 它 ， 内 要 检查 肇 四 、 执 行 和 访 存 阶段 中 指 寺 的 指令 码 。 发 再 吉 载 / 司 用 冒险 要 办 查 执行 
МВт НЕ A 0 (mrmavl Ж pop, HEENA AA ra SERO ESI ІН dr ER CER. 


29б $4* 
当 跳 转 指令 在 执行 阶段 时 ， 流 水 线 控制 逻辑 应 该 能 发 现 分 支 预 测 错 误 的 ， 这 样 当 指 令 进入 访 存 阶 段 


时 ， 它 融 能 设置 从 错误 预测 中 恢复 所 需要 的 条 件 。 当 跳 转 指令 处 于 执行 阶段 时 ， 信 和 叶 e_Bch 指明 是 
О ЕЙЕЛ ж. 


ШЕЕ ret IRET € (D ісойе, E. icode, M icode) 


ng (5E ë Ë E icode € (IMRMOVL,IPOPL]&&E  dstM€ (d srcA,d srcB) 
Firg v Р 77 x E icode = LXX && 6 Beh 





图 4.4 Жаре 

ES ЛЕНӘ ЕКПЕ ЖЩ. БАНИ ORPQ, NIE S EIULO E 

流水 线 控制 栅 制 

图 4.65 给 出 的 是 一些 低级 机 制 ， 它 们 使 得 流水 线 榨 制 逻辑 能 将 指令 阻塞 在 流水 线 寄 存 器 中 , 或 
是 往 流 水 线 中 插入 “个 气泡 。 这 些 机 制 包 括 对 425 节 中 描述 的 基本 时 钟 要 存 器 的 小 扩展 。 假 设 每 
АЕС РГ АЕ А УЕ А А. ЖЕ (ыан) 和 气泡 【bubblgy。 这 些 信 号 的 设置 决定 了 当时 钟 上 
升 时 仿 如 何 更 新 尝 水 线 寄存 器 。 人 在 正常 拘 作 下 【〔 情 况 A)， 这 两 个 输入 都 设 为 0， 司 得 寄存 器 如 载 它 
有 的 输入 作为 新 的 状态 。 当 暂停 信号 设 为 1 时 {情况 B)， 禁 小 更 新 状态 。 相反， 寄存 器 会 保持 它 以 前 
的 状态 。 这 使 得 它 可 以 将 指令 阻塞 在 某 个 流水 线 阶 段 中 。 当 气泡 信号 设 兽 为 1 时 (情况 C)， 寄 存 器 
状态 会 设置 成 基 个 固定 的 复位 配置 (reset configuration)， 得 到 一 个 等 效 寺 пор 指令 的 状态 。 一 个 流 
水 线 寄存 器 的 复位 配置 的 0. 1 模式 是 击 流 水 线 寄存 器 中 字段 的 集 台 决定 的 。 例 如 ， 坚 入 流水线 寄存 
р НАА У, ПЕН icode 字段 设置 为 常数 值 INOP С 4.724), ШЕЖЕ Е 
AA 个 气 礼 ,我们 要 将 icode 字段 设 为 INOP, 并 将 dstE  dstM .srcA 和 sreB 字段 设 为 常数 RNONE。 
确定 复位 配 普 是 硬件 设计 师 在 设计 流水 线 寄存 器 时 的 任务 之 一 ， 在 此 我 们 不 会 讨论 细节 。 我 们 会 将 
把 气泡 和 暂停 信号 部 设 为 1 看 成 是 出 错 。 

图 4.66 中 的 表 给 出 了 各 个 流水 线 寄 存 器 在 三 种 特殊 情况 下 应 该 采取 的 行动 . 对 每 种 情况 的 处 理 
部 是 流水 线 寄存 器 十 常 、 暂 停 和 气泡 所 作 的 某 个 组 合 . 

在 定时 方面 ， 流 水 线 寄 存 器 的 暂停 和 气泡 控制 信号 是 由 组 合 逻 辑 块 产后 和 前。 当时 钊 上 上 升 时 ， 这 
些 值 必 织 是 合法 的 ， 使 得 当下 一 个 时 钟 周期 开始 时 ， 每 个 流水 线 寄 存 器 要 么 加 载 ， 野 么 新 停 ， 旧 委 
产生 气泡 。 有 了 这 个 对 流水 线 害 存 器 设计 的 小 扩展 ， 我 们 就 能 用 组 合 还 辑 基本 构建 雇 、 寺 钟 宁 存 器 
和 随机 访问 存储 器 ， 来 实现 一 个 完整 的 流水 线 ， 包 括 所 有 的 控制 。 

控制 条 件 的 组 合 

到 日 前 为 止 ， 在 我 们 当 特 殊 流 环线 控制 条 件 的 讨论 中 ， 我 们 盘 设 在 任意 一 个 时 钟 周 期 内 ， 最 
多 只 能 出 红 一 个 特殊 情况 。 在 设计 系统 时 ， 一 个 常见 的 毛病 是 不 能 处 理 问 时 出 现 多 个 特殊 情况 的 
情形 ， 让 我 们 来 分 析 下 这 些 可 能 性 。 几 4.67 画 出 了 导致 特 原 控制 条 件 的 流水 线 状态 。 ЖЕНЕ 
出 的 是 解 咎 、 执 行 和 访 存 阶段 的 块 。 瞳 色 的 方 框 代表 要 出 现 这 种 条 件 必 须要 满足 的 特别 限制 。 吉 
载 /使 用 骨 险 要 求 执行 阶段 中 的 指令 将 一 个 值 从 存储 器 读 到 寄存 器 中 ， 同 时 解码 阶段 中 的 值 要 以 该 
寄 仔 器 作为 源 操作 数 。 预测 错误 的 分 支 要 求 执行 阶段 中 前 指令 是 - -个 跳 转 指令 。 对 ret 来 说 有 二 种 
可 能 的 情况 一 一 指令 可 以 处 在 解码 、 执 行 或 访 存 阶 段 。 当 ret 指令 通过 流水 线 时 ， 前 面 的 流水 线 惟 
RREN. 
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图 4.67 特殊 控制 订 件 的 流水 二 状态 


HB RIN ЖАНА 8 ET REPI B 38. 
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ИП ЖН. ЖАРЫН ЖТЖ. PL, Те ЕНЕ Н MI Н ЕЕ V 
НН НОЛ зс, Вр RERA EE CHEMBE (mrmovl 或 рор). TA ЖЕРЕ 
— ЖВНЕ Ф. ЖШ, BAAR A ret ZH dris STRE ТИЕ АЕ Pt ee PORE К ЈА lal 
Щй. DU HS Xd IHRE А TRE БІРГЕ. 

组 合 A 是 措 执 年 阶段 由 有 一 条 不 选择 分 支 的 跳 转 指令 ， 而 解码 阶段 中 有 -# ret 指令 。 出 现 这 
ТТ К ret б F Auk Ey XE НЕ. OK ERES BDE w ААА з ТАЕН У, EER ret 
指令 ， 


练习 题 4.27 
写 一 个 Y86 汇编 语言 程序 ， 它 能 导致 出 现 组 合 A 的 情况 ， 并 判断 控制 还 辑 是 和 否 处 理 正 确 . 


将 对 组 合 A 杀人 性 的 管制 动作 合并 起 来 {图 4.66)， 我 们 得 到 下 面 这 样 的 流水 线 控制 动作 【假设 
“(Maak bi ES ze is IE RERO REO: 


їй К {Г 


+15 

处 还 ret 
КЕШ ER Н w 
组 合 





йй. АЯ, A 的 处 理 与 预测 错误 的 分 区 相似 ， 只 不 过 在 取 指 阶段 是 暂停 。 幸 这 的 是 
全 下 一 个 周期 PC ЖЕРЕ ДЖ Н ТШ ЖН > huk, ІНІ а ОДВЕЛА ЖЇН. ЖАЙ 
AKA F УЛТ АЛЕН ХАН. ШЕ ПИШЕ ИЮ. ТОК ЕЕЕ ДАН ӘН ЁТ. 

HEBER ШӘЛЕ Н ЕЕ. Ир ЦӘ s Ж S fr dk esp, Rri ret B+ HC АСАН 
为 源 操 作 数 ， 央 为 它 必 须 从 栈 中 弹出 返 加 地址。 流水线 榨 制 远 辑 应 该 将 ret 指令 阻塞 在 解码 阶 成 。 


练习 题 4.28 


写 一 个 Y86;L3&iÉ a В, b E d Beds. 并 以 ha Ja sk, Fiere dig ix 
和 否 处 理 正确 ， 






LIKE Ар {Р 
Res oe C 2. 


jb EB ret 正常 
ТАШ ик 57 > 


Epi bu 





HARAB 条 件 共 控制 动作 结合 起 夹 CE 4.66)， 我 们 得 到 下 面 这 样 的 流水 线 控 制 动 作 ; 

如 霖 同时 触发 两 纽 动作， 控制 遵 辑 会 试图 暂停 ret 指令 来 避免 加 载 /使 用 冒险 ， 同 时 又 会 因为 ret 
令 而 往 解码 阶段 中 插入 一 个 气 汇 。 显 然 ， 我 们 不 希望 流水 线 同时 执行 这 帆 组 动作 。 相 反 ， 我 们 策 
Uc EUKBUT REL ДШ ЛЛ ЕЕЕ. ЖАН ret 指令 的 动作 应 该 推迟 个 周期 。 
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Aes B HW B 需要 特殊 处 理 。 实 际 上 ， 我 们 PIPE F2 7M ЖІ ШЕ ТТІ 
芯 种 组 吝 情况 。 册 使 航 计 已 好 通过 了 许 老 杆 投 漳 试 ， 它 还 是 有 曙 节 问题 ， 只 有 通过 刚直 那样 的 分 析 
才能 发 现 出 来 。 当 执行 一 个 含有 组 合 B 的 程序 时 , СНРНОНИЖЕЕНЕ D 的 气泡 和 暂 述 六 号 
邑 置 为 1， 下 个 例子 表明 了 系统 分 析 的 重要 性 ， 只 运行 正常 的 程序 是 很 开 发 现 这 个 问题 的 ， 如 果 设 
有 发 现 这 个 问题 ， 流 水 线 就 不 能 由 实地 实现 ISA 的 行为 。 
FURIEN 
[Н 4.68 6 B l DICE ES GP E] e en M]. ЕЕЕ ЕЧ СИНЕЕ E 
WPL E Ка A AE КЕЕН ЧИНЕ. REITA 4.64 的 发 现 条 件 和 图 4.66 的 动作 
HETER ЕЖ РАКИ BIS VII НСІ. ЕЙ. 
SURE SD ЕН RE SE rec. QW AYAT F PNA. 
bool Е stall = 
й Conditions for a load/use hazard 
E icode in | IMRMOVL, IPOPL ] ы 
E dstM in І d srcà, 4 srcB ) |! 
й Stalling at fetch while ret passes through pipeline 
IRET in { D icode, E ісоШшб М icode }; 





ІН 468 РРЕЯХЕЮМЯЯ 
ЕТТЕН ГЕН НІНІ. а. ШИ, тасып. BONN E boe LER. 
SIE 4.20 
Ed PIPE ТЕФ ФП stall 的 НСІ, 24, 


ARMARE e IR. ok EHE D ШШЩ SSC. Ж. Fang hh 
分 册 所 未 ， 当 过 到 加 载 /使 用 茵 险 和 ret RH riil, ЗЕ А А98, 
Бов] D bubble = 
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# Mispredicted branch 

(E icode == 1ШХХ Ев le Bch) |! 

# St'alling at fetch while ret passes through pipeline 
ІЗЕТ in | L lcode, E icode, M icode ]: 


1& 5188 4.30 
Zik PIPE 实现 中 信号 E_bubble 的 HCL 代码 。 


现在 我 们 就 讲 完了 所 有 的 特殊 沈 水 线 控 制 信号 的 值 。 在 PIPE 的 完整 HCL 代码 中 ， 所 有 其 他 的 
流水 线 控制 信号 都 设 为 0。 


4.5.10 ЖЕНЕ 

我 们 可 以 看 到 ， 所 有 溪 要 流水 线 控 制 避 旨 进行 特殊 处 理 的 条 件 ， 都 会 导致 我 们 的 流水 线 不 能 下 
实现 每 个 时 钟 周期 发 射 一 条 新 指令 的 日 标 。 我 们 可 以 通过 确定 往 流 水 线 中 播 入 气泡 的 频率 ， 来 衡量 
这 种 效率 的 损失 ， 因 为 插入 气泡 会 导致 无 用 的 流水 线 周 期 ， 一 条 返回 指令 会 产生 二 个 气 汇 ，-… 个 加 
载 /使 用 骨 险 会 产生 一 个 ， 疝 -个 预测 错误 的 分 支 会 产生 两 个 。 我 们 可 以 通过 计算 PIPE 执行 条 指 
令 所 党 要 匆 平 均 时 钟 周期 数 的 居 计 值 ， 来 曙 北 这 些 处 罚 对 整体 性 能 的 影响 ， 这 种 衡量 方法 称 为 CPI 
(cycles per instruction， 每 指令 半期 数 )。 这 种 卫 量 值 是 流水 线 平均 乔 吐 量 的 倒数 ， 不 过 时 间 单 位 是 
时 钟 凋 期 ， 而 不 是 微微 秒 。 这 是 对 “个 设计 体系 纺 构 豆 率 的 很 有 用 的 衡量 标准 。 

另 一 种 看 待 CPI 的 方法 是 ， 作 设 我 们 在 处 理 尽 上 运行 其 个 基准 程序 ， 并 观察 执行 阶段 的 还 行 。 
每 个 周期 ， 执 行 阶段 则 么 会 处 理 一 入 指 令 ， 然 后 这 条 指令 继续 通过 剩 卜 的 阶段 ， 直 到 完成 ， 要 人 么 会 
处 理 一 个 由 于 三 种 特殊 情况 之 一 而 播 入 的 气泡 。 如 果 这 个 阶段 一 共处 理 了 C, 条 指令 和 С, GB. 
那么 处 理 器 总 共 入 要 大 约 CrrCs 个 时 钟 周 期 来 执行 CC 条 指令 。 我 们 说 “ 大约” 是 因为 我 们 忽略 耳语 
动 指 流通 过 流水 线 的 周期 ， 我 们 可以 用 如 下 方法 来 计算 这 个 基准 程序 的 CP1: 


G*O go 


С, С 


CPI = 

ШЕ, СІЗТІОАЕСФАНЛ CyC,， 这 个 项 表明 执行 ЖП? TARMA BOT 
沪 。 因 为 内 有 .三 种 指令 类 型 会 导 禾 插入 气泡 ， 我 们 可 以 将 这 个 处 入 现 分 解 成 二 个 部 分 ; 

CPI - V. Ip - mp rp 

ХА, ір Coad penalty. ЖАМ) g dH ТІПЕЛЕНІҢ Ла БЕ БУТЕ АНЫ, mp 
( mispredicted branch penalty, 预 铀 错误 分 支 处 到 ) 基 当 出 于 预测 错误 取消 指令 时 插入 气泡 的 平均 数 ， 
向 rp (return penalty, 3& FEE ) EAH F тесу THEA TRR Р) 0. PrE AR E H 
该 种 原因 引起 的 插入 气泡 的 总 数 C4 的 一 部 分 》 除 以 执行 指令 的 总 数 (C,)。 

内 了 估计 每 种 处 祖 ， 我 们 需要 知道 相关 指令 (加载 、 条 慎 转 称 和 返回 ;的 出 现 频 率 ， 以 及 对 每 
种 指令 特殊 情况 出 现 的 频率 . 对 我 们 CPI 的 计算 ， 我 们 使 用 下 曾 这 组 频率 【等 同 于 [3 和 [33] 中 报告 
的 三 量 但 >; 

е 加 载 指令 《mrmoyl 和 popl) 占 所 有 执行 指令 的 259. Жтт 20952 S ims B H НІК. 

* 条 人 忻 分 支 指 令 占 所 有 执行 指令 的 20%. Hh 60% 会 选择 分 支 ， 而 ADI ETE XC. 

e 人 返回 指令 占有 有 执行 指令 的 2 旬 。 
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ШЕ, RATI SAR, ЕРІНІН. НИЕ ЖН AL POR 
М; 





三 圳 处 昼 的 总 和 是 性 季 ， 所 以 得 到 CPI 为 127。 

我 们 的 日 标 是 设计 一 个 国企 周期 监 射 一 条 指令 的 丢 水 线 ， 也 就 是 CPI 为 10. ВПП +U 
刘 日 标 ， 但 是 整体 性 芳 已 你 很 不 错 了 我们 还 能 看 到 ， 更 相 进 一 步 降 婚 CPI, ЖЕНЕ РЕЖЕ 
MUNDI ы, ПАН ЕЕ ТО 027 中 的 站 16， 因 为 条 件 转移 非常 常见 ， 我 们 的 预测 做 用 
ХЕР ШШ. ПИКИ IER S SIR, 

5 5] 4.31 

КАТЕЛ T fikata GAH LAES, HPE КАФ. КЕЛ. 
WR, hs Wii Bak. Жз СР ЖАЙ ЕНЕ? HUE AE MUR RUE, 


4511 未 完成 的 工作 

我 们 已 经 创建 了 PIPE MOKREM ERRA, TEBEH, EMTA k 
(pipeline flow) 不 足以 处 理 特殊 情况 的 访 未 厂 控制 逻辑 。 不 过 ，PIPE IAE —# руки 
设计 中 所 必需 的 革 键 特性 ， 我 们 会 强 调 其 中 一 些 ， 井 讨 地 要 增加 这 些 特 性 需要 此 什么 。 

т 

=й РЕ РЕЗА А Н НИТЕ ЕЕ. Шш. ІНЕН КЕН RC ЛЕА ВНЕ 
Hei rp. ЖЖ Cexception). ЖЖ Edi BT ERR. 它 调 用 一 个 异常 处 理 程序 Cexception 
handler)， 读 程序 是 操作 系统 的 一 部 分 。 我 们 会 在 第 8 章 中 详细 介绍 异 需 坚 理 ,执行 Bali 指令 也 会 
甬 发 一 个 异常 。 异 需 外 理 是 处 理 器 指令 集体 系 结构 的 一 部 分 ， 通 常 ， 依 圾 于 异常 的 类 型 ， 蛋 过 和 导 
致 处 理 停 止 。 也 就 是 ， 应 该 完成 到 异常 点 之 前 的 指 位 ， 但 是 该 点 后 的 所 有 指令 者 不 话 访 对 程序 员 可 
EARE ETHER. 

i — POKER RUP, Е НЕ — НАИ, Ted. ПЕНЕН БГ 
Жж. ИШ. Е—1 ЖИЕ НГ. "[ tits fF h БН ТЕҢИРИ LE ФЕН ЕН ЫЛ. 
Vy frr pj RI HH A i У, kl FE PIE AR К M EA h h piya epi. ТРЕТ 
ВЕТА ТА FUMER SEA RAE, KOK RUN Gh OK Pep ÉO S 1 ei t Wo RA. 
ЕСА Г, BRR ЙИ ЧН ФАНИ А. ЗЕ ОГ РАНЕ, dep 
ACRI TEM BIAUD IERI Rob Ез РА ЕНЕ, ИШ, НЕ SCA RR. 

第 二 个 细节 问题 是 ， 当 首先 取出 一 条 指 杰 ， 开 媳 执 行 时 ， 导致 了 一 个 异常 ， 而 后 来 由 于 分 支 锯 
测 异 误 ， 取 请 了 该 指 对 。 下 面 就 是 一 个 这 样 程序 示 例 的 目标 代码 ， 

000: 6300 | xorl &eax, гах 

ÜUxUD2: 74DeDODODüO | 1пе Target # Not taken 
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0x007: 298001000000 | irmovl 51, €eax # Fall through 


0x0D0d: 1с | halt 
ÜxÜüÜe: | Target; 
QxOQOc: ТЇ | .byte üxFF # Invalid instruction code 


БАҒЫН, ЖЕ ЕШТЕНЕ. БОНИ А ЗН B FF 的 罕 节 作为 指 今 
(由 汇编 代码 中 ,byte 指示 字 产 生 的 )。 ТАЕ УІН p ta. HEB. ЖЕЖ 
ШАА ЛЕ? ж, 因此 根本 就 不 应 该 取出 位 于 地 址 000e КН. ЖЖЖ ied e BB, 
НЕДЕ Ф LE BI. RR 

第 三 个 网 节 问 题 的 产生 基因 为 流水 线 化 的 处 理 跨 会 在 不 同 的 阶段 更 新 系统 状态 的 不 国 部 分 。 有 
可 能 会 出 现 这 样 的 情况 ， - 委 指 令 导 委 了 一 个 异 遂 ， 它 后 徊 的 指令 在 产生 异常 的 指令 完成 之 前 改变 
了 部 分 状态 。 比 如 说 ， 考 不 下 向 的 代码 序列 ， 其 中 我 们 假设 不 允许 用 户 程 序 访问 大于 0xc0000000 
Н НЕ GRE 10 章 中 讨 沦 的 现在 Linux 中 的 情况 一 样 ): 


1 irmovl $0,S$9esp # Set stack pointer to 0 
à pushl Феах # Attempts to write to ОХЕ 
3 addl %есх,%еах # Sets condition codes 


pushi 指令 导致 -个 地 址 异常 ， 因 为 减 小 栈 指 针 会 导 敏 它 绕 问 (wrap around) 到 Oxfffffffc. 1241 
阶段 中 会 发 现 这 个 异常 。 在 同一 周期 中 ，addl 指令 处 于 执行 阶段 ， 而 它 会 将 条 件 码 设置 成 新 的 值 。 
这 网 会 违反 证 贡 点 之 后 的 所 有 指令 部 不能 影响 系统 状态 的 要 求 ， 

一 般 她 ,通过 将 异常 处 理 逻 辑 合并 到 流水 线 缚 构 中 , 我 们 既 能 够 从 各 个 蜡 常 中 做 出 正确 的 选择 ， 
也 能 够 避 倪 出 现 由 于 分 支 预测 错误 取出 的 指令 遗 成 的 异常 。 我 们 给 每 个 流水 线 寄存 器 诬 加 了 -- 个 特 
殊 的 字段 sxc， 它 给 出 处 于 该 流水 线 宵 存 器 中 指令 的 异常 状态 。 如 果 一 条 指令 在 其 处 理 中 于 某 个 阶 
ЕМмЕТ ҤЕ. ЛАД Fak PLA IE RARUS. 异常 状态 和 其 他 信息 一 起 沿 着 流水 线 传 播 ， 
直到 它 和 到达 号 回 阶段 。 丰 此， 流水线 控制 逻辑 发 瑰 出 异常 ， 并 开始 取出 异常 处 理 程序 的 代码 。 

为 了 避免 异常 点 之 捷 的 指令 更 新 任何 程序 员 可 见 的 状态 ， 应 该 收 改 流水 线 控制 逻辑 ， 使 之 在 访 
上 或 号 回 阶段 中 的 指令 导致 异常 时 , 不 会 更 新 笨 件 码 麻 存 器 或 是 数据 存 便器 。 在 上 而 的 示 列 程序 中 ， 
控制 逻辑 会 发 现 访 存 阶段 中 的 push] 导致 了 异常 , 因此 应 该 禁 下 add РАНЫ ЕЕ. ОІЖ 
段 文学 所 对 应 的 PIPE 的 模拟 器 中 ， 你 会 看 到 流水 线 化 的 处 理 器 中 处 理 异 常 的 技术 实现 。) 

让 我 们 来 看 看 这 种 处 理 异常 的 方法 是 怎样 解决 我 们 刚才 提 到 的 涛 些 细 节 问 题 的 。 当 流 水 线 中 有 
一 个 或 多 个 阶段 出 现 异 常 时 ， 信 息 只 是 简单 地 存放 在 流水 线 寄 存 器 匆 异 常 状态 字段 中 。 漠 常事 件 不 
会 对 流水 线 中 的 指令 流 有 任何 影响 ， 除 了 会 禁 目 流水 线 中 后 面 的 指令 更 新 程序 员 可 卸 的 状态 《条 件 
ПЯНА), 直到 异常 指令 到 达 最 后 的 流水 线 阶 段 ,。 因为 指令 到 达 写 思 阶 段 的 顺 谍 与 它们 在 
非 流 水 线 屁 的 处 秋 器 中 专 行 的 顺序 相同 ， 所 以 我 们 可 以 保证 第 -- 条 遇 到 异常 的 指令 会 第 一 个 引起 控 
制 转 移 到 异常 处 理 娃 序 ， 如 果 取 出 了 某 条 指令 ， 过 后 叉 取消 了 ， 那 么 所 有 关于 这 条 指令 的 异常 状态 
信息 也 都 会 被 隘 消 所 有 导致 异 共 的 指令 后 面 的 指令 前 不 能 改变 程序 员 可 见 的 状态 。 挤 带 指令 的 异 
种 状态 以 及 所 有 其 他 信息 通过 流水 线 的 简单 原则 是 处 理 姓 常 的 简单 而 可 靠 的 机 制 。 

多 周期 指令 

Y86 措 令 案 中 的 所 有 指令 都 包括 些 简单 的 操作 ， 鲍 如 数字 加 法 。 这 些 操作 可 以 在 执行 阶段 一 
修 男 期 内 处 理 完 。 在 一 个 更 完整 的 指令 集中 ， 我 们 还 需 昌 实现 一 些 顺 要 更 为 复杂 操作 的 指 今 ,例如 ， 
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ШЕНИЕ, ЦАНЕ. М PPE 这 样 性 能 中 等 的 处 理 器 中 ， 这 些 操作 的 典型 执行 
时 间 从 泽 点 加 法 的 3 或 4 个 周期 到 整数 除法 的 32 个 周期 。 为 了 实现 这 些 指令 , 我 们 既 需 要 额外 的 而 
件 来 执行 这 些 计 算 ， 还 斋 要 一 种 机 制 来 协调 这 些 指 令 的 处 理 与 流水 线 其 他 部 分 之 间 移 关系 。 

实现 多 周期 将 令 的 一 种 简单 方法 就 是 只 是 简单 地 术 展 执行 阶段 过 给 的 功能 ， 添 圳 一 些 整数 和 泽 
点 算术 运算 单元 。 一 条 指令 在 执行 阶段 中 逗留 它 所 需要 的 多 个 时 钟 周 期 ， 会 导致 取 指 和 解码 阶段 暂 
停 ， 这 种 方法 实现 起 来 很 简单 ， 但 是 得 到 的 性 能 并 不 是 太 好 ， 

叮 以 通过 采用 独立 于 主流 水 线 的 特殊 硬件 功能 单元 来 处 理 较为 复杂 的 操作 以 得 到 更 好 的 性 能 ， 
通常 ， 有 一 个 功能 单元 来 执行 整数 乘法 和 除法 ， 还 有 一 个 来 执行 浮 点 操作 。 当 一 条 指令 进入 解码 阶 
段 时 ， 它 可 以 被 发射 到 特殊 单元 。 在 这 个 特 跌 单元 执行 谈 操 作 时 ， 流 水 线 会 继续 处 理 其 他 指令 。 通 
常 ， 浮 点 单元 本 身 也 是 流水 线 化 的 ， 国 此 多 个 操作 可 以 在 主流 水 线 和 各 个 单元 中 并 发 执行 ， 

不 同 单元 的 操作 必须 同步 ， 以 避免 出 错 。 比 如 说 ， 如 果 在 被 不 同 单元 执行 的 各 个 指令 之 间 有 数 
EAX 控制 逻辑 可 能 需要 暂停 系统 的 某 个 部 分 , 直到 由 系统 其 他 革 个 部 分 处 理 的 操作 的 结果 完成 。 
经 党 使 用 各 种 形式 的 转发 ， 将 结果 从 系统 的 一 个 部 分 传递 到 其 他 部 分 ， 和 我 们 前 面 看 到 的 PIPE 各 
个 阶段 之 间 的 转发 一 样 。 昌 然 与 PPE 相 比 ， 整 个 设计 变 得 更 为 复杂 ， 但 还 是 可 以 使 用 暂停 、 转 发 
以 及 流水 线 控制 等 间 样 的 技术 来 使 整体 行为 与 咕 序 的 15А 模型 相 匹 配 ， 

存储 系统 的 接口 

在 我 们 对 PIPE 的 描 这 中 ,我们 假设 取 指 单元 和 数据 存储 器 都 可 以 在 一 个 时 钟 周期 内 读 或 是 写 存 
栈 器 中 任意 的 位 置 。 我 们 还 忽略 了 由 自我 收 改 《self-moodifying》 民 码 造 成 的 可 能 骨 险 。 在 自我 惨 改 
代码 中 ， 一 条 指令 对 一 个 存 情 区 域 进 行 写 ， 而 后 面 的 指令 又 从 这 个 区 域 中 读 取 。 进 一 步 说 ， 我 们 是 以 
存储 器 位 置 的 虚拟 地 址 来 引用 它们 的 ， 这 就 要 求 在 执行 实际 的 读 或 写 操作 之 前 ， 要 将 虚拟 地 址 秋 译 成 
фин. EA. HA -个 时 钟 周期 内 完成 所 有 这 些 处 理 是 不 现实 的 。 更 糟糕 前 是 ， 正 在 访问 的 存储 
器 的 但 可 能 是 位 于 融 意 上 的 ， 这 会 需要 上 百 万 个 时 钟 思 期 才能 把 数据 读 入 到 处 理 器 存 悄 器 中 。 

下 如 我 们 将 在 第 6 章 和 第 10 章 中 讲述 的 那样 , 处 理 器 的 存储 系统 是 由 多 种 硬件 存储 器 和 管理 处 
拟 存 储 器 的 操作 系统 软件 共同 组 成 的 。 存 储 系统 被 组 织 成 一 个 层次 结构 ， 较 快 但 是 较 小 的 存储 器 保 
持 者 存储 器 的 一 个 子 集 ， 而 较 慢 但 是 较 大 的 存 情 器 作为 它 的 后 备 、 最 靠近 处 理 器 的 一 层 是 高 速 缓存 
Е #5 (cache memories)， 它 提供 对 最 常 使 用 的 存储 器 位 置 的 快速 访问 。 一 个 典型 的 处 理 器 有 两 个 
第 一 层 饲 速 缓存 一 一 一 个 用 于 读 指 令 ， 一 个 用 于 读 和 写 数 据 ， 另 一 种 类 型 的 高 速 缓存 存储 器 ， 称 为 
翻 详 后 备 缓冲 器 (translation look-aside buffer) 或 TLB, 它 提供 了 从 虚拟 地 址 到 物理 地 址 的 快速 稻 详 ， 
将 TLB 和 高 速 缓存 结合 起 来 使 用 , 大 多 数 时 候 , 确实 可 能 在 一 个 时 钟 周期 内 读 指令 并 读 或 是 号 数据 。 
因此 ， 对 我 们 的 处 理 器 引用 存 懂 器 的 简化 的 看 法 实际 上 是 很 台 理 的 。 

虽然 饥 速 缓存 中 保存 有 最 常 引用 的 存储 器 位 置 ， 但 是 还 是 有 时 候 会 出 现 高 速 缓存 不 命中 ， 也 
就 是 有 些 引 用 的 位 置 不 在 岛 速 缓存 中 。 最 好 的 情况 中 ， 可 以 从 较 高 层 的 高 速 缀 存 或 处 理 器 前 主 在 中 
找到 不 命中 的 数据 ， 这 需 监 3 一 20 个 时 钟 周 期 。 同 时， 流水 线 会 暂停 ， 将 指令 保持 在 取 推 或 访 存 阶 
段 ， 衣 到 高 速 缓存 能 够 执行 读 或 写 操作 。 至 于 我 们 的 流水 线 设计 ， 通 过 洪 加 更 多 的 暂停 条 件 到 流水 
线 控 制 还 辑 ， 就 能 实现 这 个 功能 。 高 速 缓 存 不 命中 以 及 随 之 而 来 的 与 流水 线 的 同步 都 完全 基 由 硬件 
来 处 理 的， 这 样 能 使 所 希 的 时 间 尽 可 能 地 缩短 到 很 少数 量 的 时 钟 周期 。 


| 指数 据 . 一 一 译 者 
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BIN. ЖЕЛЕ ЛЕЯ А SCR. Er EA EGET os B. 此 时 , EERTE TRA (page 
fau) EAn. AHERE- Н, JZ F YP БАНАНЕ # 58 iq И АКИТАШ. P 
后 这 段 代码 会 发 起 从 磁盘 刘 主 存 的 传送 操作 ， 一 旦 完成 ， 操 作 系 统 会 返回 到 原来 的 程序 ， 而 导致 缺 
页 的 指令 会 做 重新 训 行 ， 这 次 仔 依 占 引用 将 成 切 ， 虽 然 可 能 会 导致 育 速 缓存 不 命中 。 让 硬件 谓 几 操 
作 系 统 例 程 ， 然 后 各 闵 会 将 控制 返回 给 争 件 ， 这 不 使 得 硬件 和 系统 软件 在 处 理 缺 页 时 能 协同 工作 。 
AAD НИШ САН ЛТ ЯЯ, OS 缺 页 中 断 处 理 程序 执行 的 处 理 所 党 的 几 百 个 时 钟 周期 
对 性 能 的 影 啊 可 以 如 略 个 计 。 

ЖӘНЕН ЖЗ, ЕЛЖАН МІН НІНЕ ГІТ ТӨНЕ ІН ЕМЕ ЖАНЕ КІМНІН 
Жерде Ж, ERRATI UJ ELSE ЕН БАРМА In CHR E DRE BEC ЖИГИ. 


旁 注 ， 当 前 的 微 处 理 器 设计 

一 个 至 阶段 流水 线 ， 例 如 我 们 已 经 讲 过 的 PIPE REZ, КАТ 20 世纪 80 年 伐 中 期 的 处 理 器 
ЗКУ. Berkeley 的 Patterson 研究 组 开发 的 RISC 处 理 器 原型 是 第 一 个 SPARC ap S05 od, € 
Ж Sun Microsystems Æ 1987 年 开发 和 的 。Stanford 的 Hennessy 的 研究 组 开 发 的 处 理 器 由 MIPS 
Technologies ( 一 个 由 Hennessy 成 立 的 公司 ) 在 1986 年 商业 化 了 . 这 两 种 处 理 器 都 使 用 的 是 下 阶段 
AKAR. Intel 的 1486 处 理 器 用 的 也 是 五 阶段 流水 线 ， 只 不 过 阶段 之 间 的 职责 划分 不 太一 样 ， CAA 
个 解码 阶段 和 一 本 合并 了 的 执行 / 访 存 阶段 [21]， 

这 些 流水 钱 化 的 设计 的 知 幅 量 都 限制 在 最 多 一 个 时 种 周期 一 条 指令 。4.5.10 小 革 中 描述 的 CPI 

(每 指令 周期 ) 测量 值 不 可 能 超过 10。 不同 的 阶段 一 次 只 能 处 理 一 条 指令 。 较 新 的 处 理 器 支持 超 
ЖЖ i superscalar) 撞 作 ， 意 味 着 它们 通过 并 行 地 取 指 、 解 码 和 执行 多 条 指 售 ， 可 以 实现 小 手 1.0 的 
CPI。 当 起 标量 处 理 器 已 经 广泛 司 用 时 ， 性 能 测量 标准 已 经 内 Ср 转化 成 了 它 的 倒数 -一 一 胡同 期 执 
行 指令 的 平均 数 ， 即 IPC。 对 超标 曹 处理 器 来 说 ，IPC 可 以 大 于 1.0。 最 先进 的 设计 使 用 了 一 种 种 为 
RA ( outof-order ) 执行 的 技术 来 并 行 地 执行 多 条 指令 ， 执 行 鸭 顺序 也 可 能 完全 不 同 于 它们 在 程序 
中 出 现 的 顺序 ， 但 是 保留 了 顺序 ISA 模型 问 仿 的 整体 杆 为 。 必 为 对 程 央 优化 的 讨论 的 一 部 分 ， 我 们 
特 会 在 第 了 章 中 讨论 这 种 形式 的 执行 . 

不 过 , 流水 线 化 的 处 理 器 并 不 只 有 传统 的 用 途 , 现在 出 售 的 大 部 分 处 理 器 都 用 在 嵌入 式 系统 中 ， 
控制 着 汽 东 运行 、 消 费 产 品 ， 以 及 其 他 一 此 系统 用 户 不 能 直接 看 到 处 理 器 的 地 方 ， 在 这 些 应 用 中 ， 
与 性 能 较 商 的 模型 相 比 ， 流 水 线 化 的 处 理 器 的 简单 性 ， 比 如 说 像 我 们 在 本 章 中 讨论 的 这 样 ， 会 降低 
REPARER, 
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我 们 已 经 看 到 ， 指 令 集体 系 结构 〔 即 ISA) EARRA (SUR E EHI o A 
实现 处 理 器 之 间 提 供 了 一 层 抽 象 。ISA 提供 了 程序 执行 的 一 种 顺序 说 明 . 也 就 是 一 条 指令 执行 完了 ， 
下 一 条 指令 才 会 开始 ， 

基本 IA32 指令 集 ， 并 世人 太 简 化 其 数据 类 型 ， 地 址 模式 和 指令 编码 ， 我 们 定义 出 了 Y86 指令 
从。 得 到 的 ISA BET RISC 指令 集 的 属性 ， 也 有 CISC 指令 集 的 属性 。 然 后， 我 们 将 不 同 指令 组 织 
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放 到 五 “个 阶段 中 处 理 ， 在 此 ， 根 据 被 执行 的 指令 的 不 同 ， 每 个 阶段 中 前 操作 也 不 相同 。 从 此 ， 我 
们 构造 了 SEQ 处 理 器 ， 其 中 每 个 时 钟 周期 推进 一 条 指令 通过 每 个 阶段 。 通 过 重新 排列 备 个 阶段 ,我 
和 创建 了 SEQ+ 没 计 ， 其 中 第 一 个 阶段 迁 择 程序 计数 器 的 值 ， 它 被 用 来 取出 当前 指令 。 
流水 线 化 通过 让 不 同 的 阶段 并 行 操作 ， 履 进 了 系统 的 知 吐 量 性 能 。 在 任意 ~ 个 给 定 的 时 刻 ， 多 条 
指令 披 处 理 。 在 引入 这 种 并 行 性 的 过 程 趾 ， 我 们 必须 非 肖 小 心 ， 以 提供 与 程序 的 顺序 执行 相同 的 用 户 
可 见 的 、 程序 女 行为 , 我们 通过 往 SEQ+ 中 添加 流水 线 寄存 器 ， 并 重新 实 排 周期 来 创建 PIPE- 流 水 线 ， 
介绍 了 流水 线 化 。 然后， 我 们 添加 了 转发 晕 辑 ， 加 速 了 将 结果 从 一 条 指令 发 送 到 男 一 条 指令 ， 从 而 提 
高 了 流水 线 的 性 能 。 有 有 几 种 特殊 情况 需要 额外 的 流水 线 控制 逻辑 来 暂 售 或 取消 -一 些 流水 线 阶段 。 
仕 本章 中 ， 我 们 学 六 了 有 大 处 理 器 设计 的 几 个 重要 经 验 ， 
. 管理 复业 性 是 首要 问题 。 我 们 想 要 优化 使 用 硬件 资源 ， 在 最 小 的 成 本 下 获得 最 大 的 性 能 。 
为 了 实现 这 个 日 的 ， 我 们 创建 了 一 个 非常 简单 而 一 致 的 框架 ， 来 处 理 所 有 不 同 的 指令 类 型 。 
有 了 这 个 杠 架 ， 我 们 就 能 散在 处 理 不 同 指令 类 弄 的 逻辑 中 国共 孚 硬件 单元 。 
e 我 们 不 党 要 直接 实现 ISA。ISA 的 直接 实现 意味 着 - 个 顺序 的 设计 。 为 了 获得 更 高 的 性 能 ， 
我 们 想 翅 用 硬件 能 为 以 同时 据 行 许多 操作 ， 这 就 导 禾 可 使 用 流水 线 化 的 设计 。 通 过 仔细 的 
设计 和 分 析 ， 我 们 能 吉 处 理 各 种 流水 线 冒 险 ， 因 此 运行 一 个 各 序 的 整体 效果 ， 同 用 ISA 1 
型 对 得 的 效果 完全 - - 致 。 
e 本 件 设计 人 员 必 须 非常 说 省 小 空 。 一 旦 芯片 被 制造 出 来 ， 就 几乎 不 可 能 改正 任何 错误 了 。 
一 开始 号 使 设计 正确 是 非常 重要 的 。 意 思 就 是 ， 仔 织 地 分 析 各 种 指令 类 型 和 组 合 情 况 ， 甚 
至 十 邦 些 看 上 去 没有 意义 的 情况 ， 例 如 漳 出 栈 指 针 。 必 须 用 系统 的 模 氢 测试 程序 彻底 地 油 
Wu. 在 开发 PIPE 的 控制 逻辑 中 ， 我 们 的 设计 有 个 细微 的 错误 ， 只 有 通过 对 控制 组 合 的 
他 组 而 系统 的 分 析 才 能 发 现 。 


4.6.1 Y86 模拟 器 
本 章 的 实验 资料 久 括 SEQ、SEQ+ 和 PIPE 处 理 器 的 模拟 器 。 每 个 模拟 器 都 有 两 个 版 本 ， 
es GUI 图形 用 户 界面 ) 版 本 在 图 形 窗 口中 显示 存 财 器、 程序 代码 以 及 外 理 器 状态 。 它 提供 了 
一 种 查看 指令 如 何 通 过 处 理 器 的 力 恒 形式 。 控 制 徊 板 还 允许 你 交互 式 地 重启 动 、 单 步 或 运 
ТШ. ЖЕЕ ЖЕН та ЖЕ EM Tk Ж/Е. 
° ”文本 版 本 运行 的 是 相同 的 模 氢 器 ， 但 是 它 只 将 显示 信息 打印 到 终端 上 。 对 调试 来 讲 ， 这 个 版 
本 不 是 很 有 用 ， 人 也 是 它 允 许 处 理 器 的 和 动 测试 ， 而 且 它 可 以 运行 在 不 支持 TCVTK 的 系统 上 。 
模拟 器 玖 控制 逻辑 是 通过 将 逻辑 块 的 HCL 声明 翻译 成 C 代码 产生 的 。 然 后， 将 该 代码 编译 并 
与 模拟 代码 的 其 他 部 分 进行 链接 。 同 时 还 有 测试 脚本 ， 它 们 全 面 地 测试 各 种 指令 以 及 各 种 骨 险 的 可 
能 性 。 


参考 文献 说 阴 

对 于 那些 想 更 多 地 学 习 逻 辑 设 计 的 人 来 说 ，Katz 的 黑 辑 设计 教科 书 1391 是 标准 的 入 门 教材 ， 它 
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FEHER ЕЖ, BAHIR S £B EU S ТИНЕ. Shriver 和 Smith|69] iE 84h 
# [ AMD ЧЕН]. Intel ЖЕН 1А32 处 理 器 。 


ЖЕТЕМ) 

432% 

在 我 们 的 Y86 л ГЕП, 例如 图 4.5 中 的 Sum 函数 ， 我 们 多 次 过 到 想 将 -个 常数 加 到 寄存 器 
网 情 训 《例如 ， 第 12 和 33 行 以 及 第 14 和 15 行 )。 这 要 求 首 先 用 imo 指令 将 5838 4 58 2 B 
为 常数 ,然后 用 add 指令 掀 这 个 值 加 到 日 的 寄存 器 。 假设 我 们 想 添 加 一 条 新 指令 лада, HARU F: 


35 0 2 3 4 5 
“аме [ee ~ — — 


AX S Ta > EP h RUE V JW 33 B. ТАЗЗА ЗЕТИ АНА. n ELE irmoyl 和 
OPI 的 计算 【图 416). 

4.33 Ф 

如 3.7.2 小 节 中 讲述 的 那样 , IA32 的 指令 leave П Н] fig An Iu RE £, ТКЖ 
Y86 指令 序列 ; 


1 rrmovl %=ebp, &esp Set atack pointer to beginning of frame 
2 popl $ebp Restore saved Webb and set stack ptr to end cf 
caller's frame 


КЕЯ ув SERA NX PE iiA imr. 


un 2 1 2 3 l 5 

leave 

请 描述 实现 这 一 指令 所 执行 的 计算 。 可 以 参考 pop 的 计算 (图 4.18)。 
434 $ $ 


文件 seq-full.hcl 包含 SEQ 的 HCL 质 述 ， 并 将 常数 ADDL 声明 为 十 六 进 制 值 C， 也 就 是 iadgl 
HESAR. EREI iadd 指令 的 控制 逻辑 块 的 HCL 描述 ， 就 像 家 庭 作 小 4.32 中 描述 的 厚 样 。 可 
以 参考 实验 资料 获得 如 何 为 你 的 解答 生成 模拟 器 以 及 如 和 何 测试 模拟 器 的 指导 ， 

4.35 %% 

文件 seq-full.hel 还 将 常数 ILEAVE 声明 为 十 六 进 制 信 D， 也 就 是 leave (938 6462, ГІНЕ 
% REBP 声明 为 7， 即 %cbp 的 寄存 器 ID. BAEN leave 指令 的 控制 逻辑 块 的 HCL 描述 ， 就 像 家 
ЖЕТЕУ. 4.33 中 摘 速 的 孝 样 。 可 以 参 者 实验 资料 获得 如 何 为 你 的 解答 生成 模拟 器 以 及 如 何 测试 模拟 器 
的 指导 。 


4,38 ФФ% 

假设 我 们 要 创建 一 个 较 低 成 本 的 、 基 于 我 们 为 PIPE- 设 计 的 结构 {图 4.39 和 图 4.41) ЖЕ 
尼 的 处 理 器 ， 没 有 使 用 旁 路 技术 。 这 个 设计 月 暂停 来 处 理 所 有 的 数据 和 关 ， 直 到 产生 所 需 值 的 指令 
CABE T SERIE. 
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文件 pipe-stall.hcl 包含 一 个 对 PIPE 的 HCL КЕНГЕ, Е SB mit. EAE fu 
27 e vala Ме valB 只 是 简单 地 声明 为 下 面 这 样 ; 
ЕР DO NOT MODIFY THE FOLLOWING CODE. 
£i No forwarding.  valÀ is either valP or value from register file 
int new E valA = [ 
D icode іп { ICALL, IJXX ) : D valP; £ Use incremented РС 
l: d rvalà; £ Use value read from register file 


1; 


## No forwarding. valB is value from register file 

int new E valB - d rvalB; 

BEC IEEE НКОК Ж DERE. jG ВЕЕ АЗА ВТ A n SERT BUSES BR. {ЕЗИ Т. 
FR- ЕТ А ЕНЕ ВЈ 5, S RE PIPE ЇЙ КЕЕШ ИИ rn CS ME 
样 。 你 会 发 现 有 许多 不 同 的 组 合 ， 因 为 有 更 多 的 情况 需要 流水 线 暂停 。 要 确保 你 的 控制 逻辑 能 正确 
处 理 每 种 组 合 情 况 . 可 以 参考 实验 资料 获得 如 何 为 你 的 解答 生成 模拟 器 以 及 如 何 测试 模拟 器 的 指导 。 

4,37 9€ 

X ËF pipe-full.hel @ & — £t PIPE 的 HCL 描述 ,以 及 常数 慎 ADDL 的 声明 。 人 和 修改 该 文件 以 实现 
指令 iadd, WRZE 4.32 中 描述 的 烤 样 。 可 以 参考 实验 资料 获得 如 何 为 你 的 解答 生成 模拟 器 
以 及 如 何 测 试 模拟 器 的 指导 ， 

4.38 99 $ 

文件 pipe-full.hcl 还 包含 常数 ILEAVE 和 REBP 的 声明 。 修 改 该 文件 以 实现 指令 leave, ӘЖ 
КЕЧЕ 4.33 中 描述 的 那样 。 可 以 参考 实验 资料 获得 如 何 为 你 的 解答 生成 模拟 器 以 及 如 何 测试 模拟 器 
的 指导 。 

4,304999 

文件 pipe-nt.hcl 包含 一 份 PIPE 的 HCL 描述 ， 并 将 常数 J_YES ERAO BEARES 
的 函数 代码 。 修改 分 支 预 测 运 辑 ， 使 之 对 条 件 转移 预测 为 不 选择 分 支 ， 而 对 无 条 件 转移 和 сай NI 
为 选择 分 安 。 你 需要 设计 一 种 方法 来 得 到 如 转 中标 地 址 valC， 并 送 到 流水 线 寄 存 器 M， 以 便 从 错误 
的 分 支 预测 中 恢复 .可 以 参考 实验 资料 获得 如 何 为 你 的 解答 生成 模拟 器 以 及 如 何 测试 模拟 器 的 指导 ， 

4404999 

文件 pipe-btfnt.hcl 包含 一 份 PIPE 的 HCL 描述 ， 并 将 常数 J_YES 声明 为 值 0， 即 无 条 忻 转移 指 
令 的 函数 代码 。 修 改 分 支 预测 逻辑 ， 使 得 当 valC < valP 时 【后 向 分 支 )， 就 预测 条 件 转移 为 选择 分 
支 ,， 当 valC > ya 了 时 《前 向 分 支 )， 就 预测 为 木 选择 分 支 。 并 且 将 无 条 件 转移 和 сап 预测 为 选择 分 
支 。 你 需 归 设计 一 种 方法 来 得 到 valC 种 valP， 并 送 到 流水 线 寄存 器 M， 以 全 从 错误 的 分 支 预 测 中 
恢复 。 可 以 参考 实验 资料 获得 如 伍 为 你 的 解答 生成 模拟 器 以 及 如 何 测试 模拟 器 的 指导 。 

441999 

ERMIR PIPE 的 没 计 中 ， 只 要 一 条 指令 执行 了 load 操作 ， 从 存储 器 中 读 一 个 值 到 寄存 器 ， 并 


是 下 一 条 指令 要 用 这 个 寄存 器 作为 源 操作 数 ， 就 会 产生 “个 暂停 。 如 果 要 在 执行 阶段 中 使 用 这 个 源 
操作 数 ， 暂 停 是 避免 冒险 的 惟一 方法 。 
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HFA НЕ Е ДЕ B ТИЕН 1. P AD rmmovi 或 pashl iñ, E ERE 
HPM. ЖЕ FREH aU: 


] nrmcevl Jtet] tedi # Load Í 
2 pushl %гйх E ere | 
3 пар 

J popl Wedx E Load 2 
5 rmmovl keéeax,ü0|*edx) & Sire 2 


在 第 1 TRIS 217. mrmosd ff + M, fr fh BE UE — МІНІ. ІН pushl fid dix T LH А АЕР, 
我 们 的 PPE 设计 全 让 pushl ЗЕРЕН, ШЕФ КДН RE. Л, ИШ ИЖ], puh {ЖЕНШ 
FHRA EEE ehk MA: ПОШ sin — RES. WP 469 ор, H Ch 
m valM2 ЖИПКЕ ЕШ M 中 的 valA EE. ñr F РРА АА, ЖНА ТИШНЕ" A EM 
Г. АЖЕ yaa k kb k (load forwarding. 






әм | [ee] | 
| 


ШЫЙ свя | т чам 





Језа т | vac | wa | мав | |@шЕыМ]гтА[мВ 
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mid. ИЕ 41 的 主题 ， 


киң 309 


ЕЖ, ЕЖЕЛП ЖСН (Жатты SIF) REAREN. рор! {ЕИ 
是 是 作为 下 一 条 指令 地 址 计算 的 一 部 分 的 ， 而 在 执行 阶段 而 非 讲 存 防 段 就 需要 这 十 值 了 ， 

A， 写 出 描述 发 现 加 载 ,使 用 冒险 条 件 的 公式 ， 上 类似 于 图 4 到 rie HE 8. КТЕ НЛ 
RRI RE Sp s. 

B. XR: pipeIf.hel 包 省 一 个 PIPE PRERNA. dE E new M val ГЕ X. Ж 
来 实现 图 4. 的 中 标号 为 “Fwd A" (БІРІН. КЕҢ ИКЕНЕН ЕН Т ИА ЕН B PIE HE 3 
0, ШЕКЕ КЕЖЕ {И RE SC rm UR WE. MI HCL bcne. 
a[ EL Ж ЕНІН Ж PAL METRE НЕШ BR UL АНЫНА Ж КЕ. 

44299 

REMAKE AATRE [5ГЕ ЕГА ТЕЕ СІ, Ж PUE рор fi € 
Wu GSC IERI ETE F SSE. ШЖ. ЗС LIBRI КНП, ЖАЗП ЖЕ valE 和 
valM. Finis EHE Tu Smeg, Kp. REISSIBAd HM ID CON dstE 和 
W_dstM) 首 井 感 一 个 信号 w dstE, 同时 也 特写 回 慎 CW_valB 和 W val) 合并 成 一 个 信和 w val: 

= =s w_valE 


w da 





用 HCL "3853 E133 46 jt mi, ИГЕН: 


ІНЕ w dstE = | 
Ей writing from vaik 
W ОБЕМ !- RHONE : W dstMs: 
1: W datE; 


li 

int w_valE = | 
W dstM !- RNONE : W valM; 
L: W valE; 

|; 





Ө АЕ ИН E R H as 确定 的 
t CERES M Ai. 

ЕВНА. ЧҮГЕ ЖП M. ШЕШ НСІ. RRN: 

int w detM = RMOME; 

int w valM = Ü; 

ЕОР Е УРЬЯ pop 的 方法 。 一 种 方法 是 月 控制 还 辑 动 态 地 处 理 指 令 popl rA. 
使 之 与 下 面 两 象 指令 序列 有 一 样 的 效果 

Laddl 54, *esp 

mrmovl -4|%еяр), кА 


SERHAT EFAN. WARNO E НЙ, 
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(关于 指令 jaddi 的 描述 ， 请 参考 家 庭 作业 432) 要 注意 两 条 指令 的 顺序 ， 以 保证 pop %esp 能 正确 
工作 。 鉴 达到 这 个 日 的 ， 可 以 证 解码 阶段 的 洒 辑 对 上 面 列 出 的 popl fi RI add 指令 WAE. Ex 
了 它 会 赴 测 下 一 个 PC 与 当前 PC 相等 以 外 。 在 下 一 个 周期 ， 再 次 取出 了 pol 指令 ， 但 是 指令 代码 
变 成 了 特殊 的 值 POP2。 它 会 被 当 作 - 条 特殊 的 指令 来 处 理 ， 行 为 与 .上面 列 出 的 mrmovi 指令 一 样 。 

文件 mipe-lwhel AFA КЕНТ ПІРІН. ЖНЖ IPOP2 声明 为 十 六 进 制 值 E. 
还 包括 信号 ew_D_icode 的 定义 ， 它 产生 流水 线 寄存 器 D 的 icode 字段 。 可 以 眉 改 这 个 定义 ， 使 得 
当 第 一 次 取出 popl 指令 时 ,插入 这 个 指令 代码 。 这 个 HCL 文件 还 包含 信号 fpe 的 声明 ， 也 就 是 标 
ы) “Select PC” 的 块 CE 4.56). 在 取 指 阶段 产生 的 程序 计数 器 的 值 。 

禾 改 该 文件 中 的 控制 轴 辑 ,使 之 按照 我 们 描述 的 方式 来 处 理 pop 指令 。 吕 以 参考 实验 资料 获得 
如 何 为 你 的 解答 生成 模拟 器 以 及 如 何 测试 模拟 器 的 指 写 。 


练习 题 答案 


练习 题 4.1 答案 


手工 村 指令 编码 是 非常 乏味 的 ， 但 是 它 将 巩 国 你 对 汇编 器 将 汇编 代码 变 成 字 节 序列 汐 理 解 。 在 
下 面 这 段 我 们 的 Y86 汇 编 器 的 给 出 上 ， 每 一 行 都 给 出 了 “个 地 址 和 一 个 从 该 地 址 开始 的 字 节 序列 。 


1 0х100: | .pos 0х100 # Start generating code at address 0x 的 
2 0x100: 30830100000] | irmovl $15,€3ebx 

i OxlDE: 2031 | rrmovl Жерх,%есх 

4 0х108: | loop: 

5 0xl08: 4O0l13zdffffff | rmnmovl €ecx,-3(*ebx) 

6 DxlDe: 6031 | addl %ерх,%есх 

7 0x110: 7008010000 | jmp loop 

这 段 编码 有 些 地 方 值 得 注意 ; 


e 十进制 的 15 (第 2 行 ) 的 十 六 进 制 表 未 为 0x0000000f。 以 及 问 顺 序 来 写 就 是 全 00 00 00. 

. 十进制 -3 第 5 行 } Borat don р Оха. 07 Б RI ML 23 gk fa ff ff ff. 

. EEA OxI00 开始 。 第 条 指令 需要 6 个 字 节 ,而 第 二 条 需要 2 个 字 节 。 因 此 ， 和 多 环 

的 日 标 地 址 为 0x00000108。 以 反 品 顺序 来 号 就 是 0801 00 00. 

练习 题 42 答案 

手工 对 个 空 弛 序列 进行 解码 能 帮助 你 理解 处 理 器 面临 的 任务 。 它 必须 读 入 学 市 序列 ， 开 确定 
该 执行 什么 指令 。 接 下来， 我们 给 出 的 是 用 来 卢 生 每 个 字 节 序列 的 汇编 代码 。 在 汇编 代码 的 左 远 ， 
Жа ІҢ ЖІБИДІ Т ЗУ ЕРУІ. 

A. 带 立 即 数 各 地址 位 移 的 操作 。 


0x100: 3083Lcffffff ! irmovi 5-4, %ерх 

Пх108: 1406300080000 | rmmovl Sesi, 0хЕСО {ерх 
0xi0c: 10 | Halt 

B. & i — infoa HAER. 

0х200: ak | pushl $esi 


0x202: 8008020000 | call proc 
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0x207: 10 | halt 

Пх208: IDproc: 

0х208: 30830a000020 | irmovl 510, %ерх 

Ох2(е; 90 | ret 

C. 包含 非法 指令 指 水 字 节 Oxo 的 代码 ， 

Ох3с0: 505407000020 | mrmovl 7[£esp!,S$€ebp 

0x306; 00 | пор 

0x307: £0 | „Byte ÜOxf0 # invalid instruction code 
0x308: 1018 | popi ecx 

D. 6 ИНВЕ, 

0х400: | loop: 

0x400: 5113 | subl %есх, $ebx 

0x402: 7300040000 | je loop 

0x407: 10 | halt 

E. pushl 指令 中 第 二 个 字 节 为 非法 的 代码。 

0x500: 5362 | хорі €esl,*edx 

0x502: аб | руге xal # pushi instruction code 
9x903: BO | .byte 0x80 # Invalid register byte 
练习 题 43 答案 


КЕШЕННЕН, ЕЛЕСІ ТАЗ2 机 器 上 的 GCC 产生 的 代码 ; 


# int Sumiint *Start, int Count) 
ršum: pushl sebr 
үутоуі Феғр, %ерр 
irmovl 520, вах 
subl %еах,%ево 
pushl ерх 
mrmovl 8 (+ерр}, жери 
mrimovi 12(X&ebp),$eax 
andl %еах,%еах 
jle L38 
irmavl 5-8, ебх 
addl &edx,$esp 
irmovl] $-1,$edx 
addl £*edx,*eax 
pushl %еах 
irmovl $4,&edx 
rrmovl €ebx,*eax 
addl жейх,%еах 
pushl &eax 
call r5um 
mrmovl (Ферх), Фейх 
addi жейх, %еах 
jmp 1,39 
LiB: xor! %сах,Жеах 
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Lio: mrmov| -24iS$obp!. Sebx 
rrmnovl *ebp,*esp 
рор! *sbp 
ret 
练习 题 4.4 ЖЖ 
n pog x E SITAS ERA. pe (ci IRAN. E uE AA CD ILL X. Jede 
ЖЕЕ, qu eux eB e tro dx ЖИЕНИ. 并 确保 每 个 实现 部 遵守 了 这 个 惯例 。 
这 个 测试 中 subl 指令 比较 了 %esp 的 初始 值 和 庄 入 栈 中 的 值 。 相 碱 的 结 有 为 0,， DOR SE CA FIM 
前 是 5esp ИЮ ЖИК. 


练习 题 4.5 ЖЖ 

TEREA АШ ЕШ Н ЈН 中。 不 过 ， 我 们 还 是 坚 确 定 一 个 悄 例 并 遵 种 它 。 
这 个 代码 序 绚 将 tal ЖАЯ, ЯНВ евр 1, ДОШ ШИВ. БАН ЖЕР T tyal， 我 们 可 以 
推断 出 рор! Фезр 应 该 是 将 栈 指针 设置 为 从 丰 稍 器 中 访 出 的 和信。 因此 ， 它 等 愉 于 指令 mrmov1 


ür$espl: $esp- 


练习 题 46 答案 
EXCLUSIVE-OR. (Ле) p CER Чу: 
әсі ec = ila && b) | là АБ Ib; 


X. f S eq 和 xor 是 互补 的 。 也 就 是 ， “个 等 于 |， 男 一 个 就 等 于 0。 

练习 题 4.7 答案 

EXCLUSIVE-OR 中 路 的 输出 是 位 相等 值 的 补 , 根据 德 摩根 定律 《 同 2.7), 我 们 能 用 OR 和 NOT 
实现 AND， 得 到 如 下 市 路 








Әи-- | tega 
AOT — 

84. — 

Бар 1 eqan 


| CON ч 
— | Гі. ге Eq 
b: ІШІ!) 
Хоу 
Я — 
b ! eq 
Хог 
ар 7 | 


练习 题 4.8 ЖЖ 
这 个 疏 计 只 是 对 从 一 个 输入 中 找 出 虑 小 值 的 设计 做 了 点 简单 的 改变 ， 


int Med3 - [ 
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А <= B kk B <= C : B; 
B <= А && А <= C t: А; 
1 DOC; 
l: 
练习 题 4.9 答案 
这 些 练习 局 种 个 阶段 的 计算 更 如 其 体 ,从 口 标 代 码 中 我 们 可 以 看 到 , 指令 是 位 于 地 址 0x00e 的 。 
它 包 含 6 个 字 节 ， 前 两 个 字 节 为 0x30 和 0x84。 后 四 个 字 节 是 0x00000080 《十进制 128) EFIE 
过 来 的 形式 。 






irmcvl 5128, %евр 


icode:ifun — Mi[üxüDe]e3:0 
ҒАЛВ — Mi[0x05£]28:4 


маі — М[0х010]=128 


ЕҢ icode:ifun -- M. [PCJ 
ГАВ — Mi[PC+1] 
valo — M.[PCG422] 
valP — РС+6 valP — 0х0бе+ё=0х014 


ий 

M pem ee 
` | _ 

PC ~ valP PC = маіР = 0x014 


这 小指 今 糙 寡人 存 器 各 esp i79 128, ТЖЕ PC б. 


练习 题 4.10 答案 
我 们 可 以 看 到 指令 位 于 地 址 0x01c， 有 两 个 字 节 ， 值 分 别 为 0xb0 和 0x08. push 指令 【第 后 行 ) 
将 寄存 器 镶 esp 设 为 了 124， 存 赃 器 中 该 位 置 存储 着 的 值 为 9。 


阶段 


























МЕҢІ 


X118 icodeifun 一 МІРС) 
ГАВ = М[РС+1] 
valP — PG+2 


ий ҰША — R[tesn] 
valB = R[&esp| 
valM — Maval] valM = M4I222]-8 
[| R[&esp) = valE R[$esp] — 128 
RI — valM [евр] + 9 
er 


АЖ 


popl £eax 


iCodezfun — MEO D1c]ebp:0 
rA JB — Mjoxold]-0:8 
















valP — üxüic4-2-üxüle 
val — Е[%е=рј=124 
valB — R|%esr]=124 
valE — 124442128 
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成 指令 将 %eax Л 9. евр СА 128, ӘҢ PC 1 2. 


练习 题 4.11 答案 
小 着 图 4.18 中 列 出 的 步 台 ,将 rA 看 成 名 esp， 我 们 中 以 看 到 ， 丰 访 存 阶段， 指令 会 将 vaa (El 
Hint mnt ЕЛЕ ат, SAIDETA32 中 发 现 的 一 样 : 


练习 题 4.12 答案 

HAR 4.18 ІН ІНЕ. J$ IA 看 成 名 esp， 我 们 可 以 看 到 ， 商 个 巡回 损 作 都 会 更 新 铝 esp。 由 
为 写 valM 的 探 作 后 发 生 ， 指 令 的 最 终 效 果 会 是 将 从 存储 器 中 读 册 的 值 写 入 Gesp， 总 像 在 TA32 中 看 
到 的 -F. 


ио] 413% 

我 们 可 以 看 到 这 条 指令 位 于 地 址 0x023， 长 度 为 5 个 字 节 。 第 P f HB 0х80, ІШІН 4 
Д А Е 0x00000029， 印 调用 的 日 标 地 址 按 字 节 反 过 的 形式 ，popl 指令 {第 7 行 ; 将 栈 指 针 设 为 
128. 


call Des 


icodaifun 一 Mj[PC] icodeifun — MjIoxo23]28:2? 


val = МДЕС+1| valC = Ma[0x024]-0x023 
valP — РС+5 valP — 0х02344-0х028 


Nun 
valB — R[tesz| valB — R[&esp]-128 


valE — valB+-4 valE = {28+-4=124 


MalvalE] — уар М[124] + 0x028 





НЕКЕНІ ЕЖ Февр 设 为 124, Ж 0x028 СЕЕН) ҮЙЕ АИ ЕЕН. X34 PC 
设 为 0x029 CHAR [1 ЖАНЕ). 


练习 题 4.14 答案 
练习 题 中 所 有 的 НСІ. 代码 都 很 箭 单 明了 , 但 是 试 着 月 忆 写 会 帮助 你 思 兰 各 个 指令 ， 闲 及 如 和 何 处 
草 它 们 。 对 才 这 个 问题 ， 我 们 只 要 看 看 Y86 的 指令 集 (图 4.2)， 确 定 哪些 有 常数 字段 。 
bool need vall = 
іссйе in | IIRMOVL, IRMMOV., IMRMOVL, IJXX, ICALL 1; 
练习 题 4.15 答案 
这 段 代码 类 似 王 sreA 的 代码 ， 
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int srcB = [ 
icode in { IOPL, IRMMOVL, IMRMOVL  : rB; 
icode in { IPUSHL, IPOPL, ICALE, IRET } : sESP; 
1 : RNONE; # Don't need register 

]: 


55304.16 答案 
ж\е F dstE 的 代码 : 


int dstM = | 
iccde іп | IMRMOVL, IPOPL } : га; 
1 : RNONE; 8$ Don't need register 
1; 


练习 题 417 ЖЖ 
像 我 们 在 练习 题 412 中 发 现 的 那样 , АТ ЖЕУ EG an ӨНЕ W E besp, 我 们 想 让 通过 М 
mO BRR RECTORE E 端口 写 ， 


练习 题 4.18 答案 
这 段 代 码 关羽 于 aluA 的 代码 ， 
int aluB = | 
icode in ( IRMMOVL, IMEMOVL, IOPL, ICALL, 
IFUSHL, IRET, IPOPL } : valk; 
icode in ! IRRMOVL, IIRMOVL ) : 0; 
& Other instructions don't need ALU 


1; 


练习 题 4.19 答案 
这 段 代码 类 似 于 mem. абд 的 代码 : 


int mem data = | 
# Value from register 
icode in { IRMMOVL, IPUSHL 1 ; yal: 
# Return PC 
icode == ICALL : уа1Р; 
к Default: Don't write anything 
1; 


Ag 4.20 答案 
这 段 代 码 类 似 下 mem read 的 代码 ; 


2001 mem write = icode in ( IRMMOVL, IPUSHL, ICALL }; 
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488 421 Ne 

jk is LL EE ER AO]. TARA PE A PPS etika A. € EGRE SEE E UK EX 1 
ШЕТІ "n А 

А. ЖАВ R IR, БЕТА. ВАС 在 第 一 阶段 , SED. EA F ER 7 
段 。 第 :阶段 的 延迟 为 170ps, PR ИДЕ A) 170+20=190рѕ. EE RE Ж 5.26 GOPS, 
AITE 2; 380ps. 

B. Я— ИШИ КА ЖИ. suAfEDIRAGBDBGES СИН. АСО (Е NE ПЕ 
F 在 第 -HE ШАА БЕНО ШЕН ПОр, ЛЕС Е 0 130рз. ТТН. RA 7.69 GOPS. 
ЖҮТІМІНІ /) 390р». 

С. ШИИ ЖЕ ЖР, RANE Е, RACAR NE. нр Е Те, m 
IE LF fE ЖИЕ. WE P 90рѕ, АТО ЈА Е ЕД ПОрв, m Ana 9.09 GOPS. 
TATTIN [n] Àj 440ps . 

D. Fil ЕЛЕК. ER T ERI FATATA e HER TI OPER. 

周期 时 长 为 80+20=100ps, «ПП у A £3 10.00 GOPS, iiid fTI i 7j 500р5. ЖЕ ЖЕСІН Ж 
会 有 帮助 了 ， 因 为 不 可 能 使 流水 线 运行 得 比 以 100ps Xy — S] ЛИЗА Т. 


练习 题 4.22 答案 
在 这 种 极限 情况 КЖ НЕ ПАНЫ ЛІ e ns ЕЛІН М е-20 ps, AIER А) 10004 
+20) ШЙ ИЕ SE ХА. кк T 0, [ЕҢ etm 50.00 GOPS。 


练习 题 4.23 答案 
这 段 代码 内 是 给 SEQ ИЧЧИ S dm Br Un дуа "D 
int now E astE = | 


D ісейе іг 1 IRRMOVL, IIRMOVT, ТОРТ : D rB; 


D 1code ір + ТС, TFOPL, IUALL, IRET ! : REST; 
1 : BNONXE; # Don't need register 

] : 

练习 题 4.24 答案 


Н i pop f > CS АЯТ») xus nee аА S., mmol 指令 【第 和 行 ) zT ТАҢ. "I 
АЖ АА, рор! 指令 处 于 沪 存 阶段 , 熏 MdstE 和 M.dstM iE Fesp. ІН PLK, 
ЛАЖАМ valE В ИС a TEORI S ARAE ВЕДЕ) mmol ІН F 28. 3138 
2149 4.5 TL RE ЧАК рор! %esp ПИА 48 — iE. 

练习 题 4.25 答案 

这 个 各 昨 计 你 体验 КӘНЕ — МЕН E EE 3 —)8 — S Er Sh tas ШАР. NH 
m. WRM A ТЕМ HEMARA ПІН ЕТІНЕН mL H SB X НЕ ДАНЕ, ЕРЕН 

xs Ht. 

k] g), Ж п} ЕД НА ЖЕЙ 424 中 后 未 的 程序 稍微 修改 了 一 点 多 版 本 ，; 


— см ans К м м Lr 


irmovl $5, %edx 


irmovl SOx100,*esp 


rmmovl %едх,О(%евр} 


popi $esp 


nop 


nop 


rrmovl $esp,$eax 


两 个 пор 指令 会 导致 当 пон 指令 在 解码 阶段 中 时 ，Ppopl Rip SIR, ЖЕР 
ERHAN TERRE RRRS, RAFTE Zea 会 设置 成 增加 了 的 程序 计数 器 ,而 不 是 从 存 


KE SK Ж ЖЕ 


储 器 中 读 出 的 值 。 

练习 题 4.26 答案 

TEM Дн ЖЫ ЕЛЕ ЖОЙ: 

int new E valB = [ 
d src3 == E dstE : e valE; # Forward valE from execute 
d srcB == M dstM : m valM; & Porward vaiM from memory 
d srcB -- M dstE : M, valE; # Forward valE from memorv 
d srcB == W dsViM : W,valM: # Forward valM from write back 
d src3 == М dstE : W valE; # Forward valE from write back 
1: d rvalE; # Use value read from register file 


І! 


练习 题 4.27 ЖЖ 


下 面 这 个 测试 程序 是 设计 用 来 建立 控制 组 合 A《〈 攻 4.67)， 并 探测 是 否 出 了 错 : 


1 
2 
3 
4 
5 
б 
7 
8 
3 


Ж Code to generate a combination of not-taken branch and ret 


target: 


rtnp: 


irmovl Stack, esp 


irmovl rtnp,€eax 


pushl %еах 
Xorl %еах,%еах 
jne target 
irmovl $1,$e6ax 
halt 

ret 

irmovi $2,€ebx 
halt 

irmovl $3,£&edx 
halt 


# Set up return pointer 

# Set Z condition code 

# Not taken (First part of combination) 
# Should execute this 


# Second part of combination 


# Should not execute this 


# Should not execute this 
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14 .pos 9х40 
15 Stack: 


WV x T ERES Ti ОБЛЫ КАРТ ге dB $0 dj. ARRAT ЖУН irmovl | 
5. Raik. АН, AKR RRA ЖОЖ SPA EUG A. IX DUI LU ВА SCHLRU A F Py 
SOS. xd du ЕЕЕ НЫ PAIS BRINGT ERRARE. 
练习 题 4.28 答案 
下 和 面 立 个 测试 程序 是 设计 用 来 建立 控制 组 台 B (图 4.67) 的， 模拟 器 会 发 现 流水 线 寄 存 器 的 气 
汽 各 暂停 控制 信号 都 设置 成 0 的 情况 ， 因 此 我 们 的 油 试 程序 只 需要 建立 它 希 要 发 现 的 组 全 情况 ， 直 
ХЕ АРЫНАН ҒАНЫ, ЖЕНЕ. 


# Test instruction that modifies Фер followed by ret 


2 irmovi mem, %ерх 

3 mrrovl Q(tebx),tesp # Sets Жезр to point to retum рош! 
4 ret Ж Returns то return point 

5 halt # 

6 rtnpr: irmovl $5,%ев1 & Return point 

T ralt 

8 .pos 2x4 

5 тегт: .long stack & Holds desired stack pointer 

14 ров Oxbü 

MI stack: long rtnpc # Top of stack: Holds return point 


APERE 了 存储 器 中 两 个 初始 化 了 的 字 。 第 - -个 字 (mem) 保存 着 第 一 个 字 tack — H3 
НЕН Rak. АЕМ ret 指令 期 望 的 返回 点 的 地 址 ,这 个 程序 将 栈 指 针 加 载 到 %esp， 
于 执行 ret 指令 ， 

练习 题 4.29 答案 

M 4.66 我 们 可 以 看 到 ， 巾 于 如 载 /使 用 肯 险 ， 流 水 线 寄存 器 了 D 必须 暂停 ， 

boo. D stall. - 

4 Conditions for a load/uso hazard 
КҚ icode in í iMRMOVL, IFOPL } kk 
E dstM in ( d sre, d srcB }; 


练习 题 4.30 答案 

ЖЕ 4.66 中 我 们 可 以 看 到 ， 由 于 加 载 /使 用 骨 险 ， 或 者 用 于 分 支 预 测 错误 ， 流 水 线 窜 存 指 下 2 
AL E RE HU: 

bool E bubble = 


# Mispredicted branch 
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(E icode == І0ХХ && !e Bch) |l 
# Conditions for a Ioad/use hazard 
E icode in í IMRMOVL, IPOFL ] &k 

E dstM in ( d агсА, d srcB'; 


练习 题 4.31 EXE 


此 了 时， 预测 错 误 的 频率 居 0,35. 83 mp-—020x035x2-0.14, TEA CPLÀ 125. ВЕЙ 
获 非 常 小 ， 但 是 如 果实 现 新 的 分 交 挤 测 策 路 的 成 本 涉 是 入 向 欧 话 ， 这 样 做 还 是 但 得 的 。 
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fis se РАЛЕ EARS: $X—. ЯЛАН АНТЕНИ 3S s RICO 
ЖЫ s LH a T e 8 ЖЛ CU e ROSE НИТ ICI LEGI. WJ Fi s 0. ИЛЕН 
AIRE J AI НЕЕ ы. ПРЕ, STET CERRAR zs 
化 方式 很 人 的 变化 。 有 些 编程 语言 比 其 他 语言 容易 优化 得 多 。C RETE. Minhi ЕИ А 
强制 类 型 转换 的 能 力 ， 使 得 对 它 优 北 很 困 难 。 程 序 员 经 常 能 够 以 一 种 使 编译 器 更 容易 产生 名 效 代 蚂 
的 方式 来 编写 他 们 的 程序 。 

(EREREGEAZRV ВЕ П, ВЕТЕНО Е тА, МАНТИ XE. ШТ, 
З PAURTAE PR PF i Bi 8 FE SD TEE LAE СТАТ Әй. ERER Г. ЛОМ 
He a А ЛА А HE, пп - em НЕВЕ ERT пу Be 3E Kak E EAR [Н] SCHUM EAE 
(pf b, ИКЕМІНЕ AE ПОК НЕН РНЕ aQ АЯ, ПЕЕ ita, ШЖ ШЕ 
HRT E РКА ЧЕ Н Е а НОЕ АЕ, СА НРА НАГ. 
ДІЛ OK du ta EE y SE ADE 92—180, 4] РН АЕР ЕА ТАЧИ, a 
ЖЕН, ARE Ида а Ue. 

QA EO, WE EGmERERIBOR. ИИК ИНЕ. INESSE BEP ЖЕР ИГІ ІНЕ 
Rf, ЖРА АЛЕН АН. ROC BLS. 事实 上 ， 编 详 器 只 能 执行 有 限 的 程 译 
转换 ， 而 日 娘 碍 优化 的 因素 《optimization blocker) 还 会 阻碍 这 种 优化 ， 芒 得 优化 的 因素 就 是 程序 行 
为 中 那些 闫 重 依 操 十 执行 环境 的 方 血 。 程 序 员 必 顷 编 写 容 易 优化 的 代码 ， 以 帮助 编 详 融 。 豆 编 详 具 
来 说 ， 编 译 技术 被 分 为 “与 机 骂 无 其” 和 “与 机 路 有 关 ” 两 类 .“ 与 机 器 无 关 ” 的 意 轩 是， 使 用 这 些 
技术 时 可 以 沾 做 虚 将 执行 代 妈 的 计算 机 的 特性 ， 而 “与 机 器 有 关 ” 是 指 ， 这 些 技术 是 依赖 于 许多 机 
器 的 低级 纲 性 的 。 我 们 的 讲述 也 沿用 了 类 羽 的 顺序 , 先 讲 编写 任何 程序 时 都 鉴 执行 前 标准 程序 转 竟 ， 
然后 讲 效 闪 依 赖 十 逢 标 机 器 和 编 详 器 特性 的 转换 。 这 些 转 换 通 常 还 会 降低 代码 的 模块 性 各 四 读 性 ， 
Е, КВЫ КЕНЕА АНК, ЯНЫ Ж, 

ТВЛ ПЕВ AE. ЕНЕР ТО a a НМЕ АО, ЕВА ДЕННЕ, АЖ 
首 个 探 作 的 时 序 特性 。 例 如 ， 编 详 器 必须 知道 时 序 信 息 ， 才 能 够 确定 是 焉 要 ЖУН», ЖЕН 
Y 和 加 符 的 车 种 组 合 。 现 代 计 算 机 用 复杂 的 技术 来 处 起 机 器 级 程序 ， 并 行 焉 行 许多 指令 ， 而 县 执行 
潜 序 还 中 能 不 同 于 它们 在 程序 中 出 现 的 路 序 。 程 序 员 必 须 理解 为 了 获得 最 大 的 速度 ， 这 些 处 理 器 是 
如 何 工 作 来 调整 程序 的 。 基 于 Intel 处 理 器 的 最 新 模型 ， 我 们 提出 了 - -个 这 种 机 器 的 襄 级 模型 。 我 们 
还 设计 了 一 种 图 形 表 示 法 ， 可 以 用 来 使 处 理 器 执行 指令 形象 化 ， 并 且 还 可 以 预测 程序 性 能 。 

找 们 以 对 优 亿 大型 程序 的 问题 的 讨论 来 结束 这 A. 我们 描述 了 代码 训 析 程序 (profiler) 的 使 
用 ， 代 人 硒 剖析 程序 是 测量 悍 序 各 个 部 分 性 能 的 工具 。 这 种 分 析 能 够 帮助 找到 代码 中 低 效 率 的 地 万 ， 
并 廿 确定 程序 中 我 们 应 该 着 重 优化 的 部 分 。 最 后 ， 我 们 给 出 了 一 个 重要 的 观察 结论 《〈 称 为 Amdahl 
定律 )， 它 量化 了 对 系统 某 个 部 分 志 行 优化 所 带 来 的 整体 效果 ， 

芷 .本章 的 描述 中 ， 我 们 使 每 代码 优化 看 起 来 像 接 照 某 种 特殊 顺序 ， 对 代码 进行 一 系列 转换 的 简 
单线 性 过 程 。 实 际 上 ， 这 项 工作 远 上 者 这 么 简单 。 需 要 相当 多 的 试 错 法 试验 。 当 我 们 进行 到 乒 面 的 优 
化 阶 让 要， 这 种 方法 苑 其 有 用 ， 到 那 时 ， 看 上 去 很 小 的 变化 会 导致 性 能 上 很 大 的 变化 。 相 反 ， 一 些 
很 有 和 希 庚 的 瓜 术 被 证 明 是 无 效 的 。 正 邵 我们 在 后 面 的 例 了 中 看 到 的 那样 ， 要 确切 解释 为 什么 某 段 代 
妈 友 列 有 某 个 执行 时 间 ， 是 很 困难 欧 。 性 能 可 能 依赖 十 处 理 器 设计 的 许多 详细 特性 ， 而 对 此 我 们 所 
知 其 少 。 这 也 是 我 们 尝试 各 种 技术 的 变形 和 组 合 的 另 一 个 原因 ， 
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研究 江 . 编 代码 是 理解 编译 器 以 及 产生 的 代码 会 如 何 运 行 的 最 有 效 的 手段 之 一 。 仔 细 研 究 内 循环 
的 代码 是 一 个 很 好 的 开端 。 人 们 可 以 确认 降低 性 能 的 属性 ， 例 如 过 多 的 存储 器 (memory) 引用 和 对 
寄生 器 不 正确 的 使 用 。 从 所 编 代码 开始 ， 我 们 甚至 可 以 预测 什么 操作 会 并 行 执行 ， 以 及 它们 使 用 处 
#Ë g ИО Ж ШЇП]. 


5.1 优化 编译 器 的 能 力 和 局 限 性 


现代 编 详 器 运用 复杂 精细 的 算法 来 确定 一 个 程序 中 计算 的 是 什么 值 ,以 及 它们 是 被 如 何 使 用 的 。 
然后 它们 会 利用 一 些 机 会 来 简化 表达 式 ， 也 就 是 在 儿 个 不 同 的 地 方 使 用 个 计算 ， 以 降低 一 个 给 定 
的 计算 必须 被 执行 的 次 数 ， 编 译 器 优化 程序 的 能 力 受 几 个 因素 限制 ， 包 括 : “КЕТЕЛЕКТЕ 
确 的 程序 行为 ， 它 科 对 程序 行为 、 对 使 用 它们 的 环境 了 解 有 限 ， 需 要 很 快 地 完成 编译 工作 。 

编 详 器 做 化 对 用 户 来 涪 应 该 是 不 可 见 的 。 当 程序 员 用 优化 选项 (例如 ， 使 用 -O 命令 行 选项 编 
详 代 码 时 ， 代 码 的 行为 应 访 和 不 带 优 化 编译 得 到 的 代码 行为 完全 一 样 ， 除 了 它 应 沪 运 行 得 更 快 一 点 
以 外 。 这 样 的 要 求 使 得 编译 器 不 能 使 用 某 些 类 型 的 优化 。 

РШ. 4 FIEDEBSRIDES 
void twicdlelíint *xp, int *ур) 
{ 
“Хр += "yp; 
*хр = “ур; 


void twiddle2(int *xp, int *yp) 


1 
2 
3 
1 
5 `] 
6 
7 
8 d 
9 


*хр -= 2* *ур; 

10 } 

乍 一 看 , 这 两 个 过 程 似乎 有 相同 的 行为 。 它们 都 是 将 存储 在 出 指针 yp 指示 的 位 置 处 的 值 两 次 加 
到 指针 xp 指示 的 位 置 处 的 值 。 另 方面 ,函数 twiddle2 效率 更 高 一 些 。 它 只 要 求 -次 存储 器 引用 
(该 +xp， 访 *yp， 写 *xp)， 而 twiddlel 需要 六 次 〈 两 次 读 *xp， 两 次 读 *yp， 丙 次 写 txp)。 因 此 ， 如 
朱 要 网 详 器 编译 过 程 rwiddle1， 我 们 会 认为 基于 twiddle2 雪 行 的 计算 能 产生 更 有 效 的 代 公 。 

不 过 ， 考 虑 一 下 xp 等 于 yp 的 情况 。 此 时 ， 消 数 fwiddlel 会 执行 上 面 的 计算 ， 

3 *xp += *xp; /* Double value at xp */ 

4 *xp += *xp; /* Double value ағ xp */ 

结果 会 是 xp 的 值 增 如 4 倍 。 另 方面， 函数 twiddle2 会 执行 下 面 的 计算 ; 

9 *xp += 2* *xp; /* Triple value at xp */ 

Aim дЕ xp 的 值 增加 了 倍 。 编 译 器 不 知道 twiddlet sibique HJ, Et A IR Ж xp 和 
yp 可 能 会 相等 。 因 此 ， 它 不 能 产生 twiddle? 风格 的 代码 作为 twiddlel 的 优化 版 本 。 

这 个 现象 称 为 存 情 器 别名 使 用 (memoiy aliasing)。 编 译 器 必须 假设 不 同 的 指针 可 能 会 指向 存储 
器 中 同一 个 位 置 。 这 造成 了 个 主要 的 妨碍 优化 的 因素 ， 这 也 是 可 能 闫 重 限制 编 详 器 产生 优化 代码 
机 会 的 程序 的 一 个 方面 。 
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ЕЛ 5.1 

下 面 的 问题 说 明了 存 鱼 器 列 名 使 用 可 能 会 导致 意 引 不 到 的 程序 行为 的 方式 。 考虑 下 面 这 个 交换 
两 个 值 的 过 程 ， 

1 — ftSwap value x at xp with value y at yp */ 


2 void swapi(int *xp, int *vp! 

3 { 

4 *xp = *xp + *vp; #* x+y *j 

5 кур = *Xp - *vp; #{##х+у-у=х*! 
6 *хр = 'xp - *үр; /*x4y-x- y *] 
7 } 


ЗХ ОАЕ А xp 等 于 yp. ЖАН АНИ ЖЖ? 
ЖИЕККЕ X RH. Е, SE FEXPTHB: 


1 int fiint); 


2 

3 int furcl(íx] 

4 { 

5 return fix) + fix) + fix) + flx); 
б ) 

- 

2 int Ёипс2{х!) 

9 l 

11) return 4*F(x); 

11 } 


RHE LATE ВАВ ЕНЕ, ІНЕ fane2 只 调用 工 - -次 ， 而 funcl VEI Г}. 
以 fnel EAW, 24648 р fune2 MARRI, 
^x, # FE ғақ. 


int counter = 0; 


1 

д 

3 int fiint x) 

4 | 

5 return counter++; 
6 | 


这 个 函数 有 个 副作用 -一 它 收 改 了 全 局 程序 状态 的 一 部 分 。 改 变调 用 它 约 次 数 会 改变 程序 的 行 
为 ,特别 地 , 假设 开始 时 全 局 变量 counter 都 设置 为 0, 对 funcl 的 调用 会 返回 0+1+2+3=6, 而 对 func2 
的 调用 会 返回 4.0=0。 

大 多 数 纺 译 嚣 不 会 试图 判断 一 个 隙 数 是 否 没 有 副作用 ， 因 此 任意 晴 数 都 可 能 是 优化 的 候选 者 ， 
例如 func? 中 的 做 法 。 相 反 ， 编 译 器 会 假 没 最 糟 的 情况 ， 并 保持 所 有 的 消 数 调用 不 变 ， 

在 各 种 编 详 器 中 ，GNU 编译 器 GCC 被 认为 是 胜任 的 ， 但 是 就 它 的 优化 能 力 来 说 ， 并 不 是 特别 
突出 。 它 完成 基本 的 优化 ,但 是 它 不 会 对 程序 进行 更 加 “有 进取 心 的 ” 编 详 器 所 做 的 那 种 激进 变换 ， 
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Wb. [Hj GCC 的 程序 员 必 须 花 费 更 多 的 精 方 ， 以 -- 种 简化 编译 器 生成 高 效 代 码 的 任务 的 方式 来 
编写 程序 。 


52 表示 程序 性 能 


我 们 需要 一 种 方法 来 表示 程序 性 能 ， 它 能 指导 我 们 改进 代码 。 对 许多 程序 部 很 有 用 的 度量 标准 
是 每 元 素 的 周期 数 (cycles per element，CPE)。 这 种 度量 标准 帮助 我 们 在 更 详细 的 级 别 上 理解 选 代 
程序 的 答 环 性 能 。 同 时， 这样 的 度量 标准 对 执行 重复 计算 的 程序 来 说 也 是 很 踪 当 的 ， 例 如 处 理 图 像 
т ж. ЖЕАР ЕЛИ Е Ж. 

处 理 器 活动 的 顺序 是 由 时 钟 控 制 的 ， 时 钟 提供 了 某 个 频率 的 规律 信和 号， 要 么 用 兆赫 益 (MHz. 
ШЕЛ ЖЕ) 来 表示 , SEAT Je ERE (GHz, 即 吉 周 每 秒 ) 来 表示 。 例如 , 一 个 系统 有 “1.4GHz” 
处 型 器 ， 芝 表 水 处 理 器 时 钟 运行 频率 为 1400 JE RE 22. 每 个 时 钟 周期 的 时 间 是 时 钟 频 率 的 倒数 ， 通常 
是 用 纳 称 (nanosecond， 十 亿 分 之 一 秒 ) 来 表示 的 。 一 个 2GHz 的 时 钟 其 周期 为 05 ЖР, 而 500MHz 
的 时 钟 ， 周 期 为 2 纳 秒 。 从 程序 员 的 角度 来 和 看， 用 时 钟 周期 来 表示 度量 标准 要 比 用 纳 种 来 者 示 有 大 
助 得 多 。 用 时 钟 周期 来 表 水 ， 度 量 值 不 太 依 赖 于 被 评估 的 处 理 器 的 模型 ， 而 这 些 度量 价 能 帮助 我 们 
确切 了 地理 解 机 器 是 如 人行 执行 程序 的 。 

许多 过 程 含有 在 - 组 元 素 上 迭代 “的 循环 。 例如， 图 5.1 中 的 消 数 узот 和 vsum2 计算 的 都 是 
两 个 长 度 为 垃 的 癌 量 之 和 。 第 一 个 国 数 每 次 选 代 计算 目标 同 量 的 -个 元 素 。 第 一 个 图 数 使 用 称 为 析 
HÆF (loop unrolling) 的 技术 ， 每 次 选 代 计算 两 个 元 素 。 这 个 版 本 兵 对 于 为 偶数 值 有 效 ， 芷 本 章 
后 面 ， 我 们 将 更 售 细 地 介绍 往 环 展开 ， 包 括 如 何 使 它 对 任意 ИНА. 

这 样 一 个 过 程 所 需要 的 时 间 可 以 用 -个 常数 加 上 一 个 与 被 处 理 元 素 个 数 成 正比 的 因子 来 描述 。 例 
M. А 5.2 ДАМ УАТ ЕКЕ КЕ АҒ п 值 的 取 值 范围 图 .使 用 最 小 二 乘 方 拟 合 《]east 
squares fit), 我 们 发 现 ,两 个 函数 的 运行 时 间 ( 朋 时钟 周期 表示 ) 分 别 近 似 于 表达 式 80+4.0п 和 83.5+3.5n 
的 线条 。 这 两 个 表达 式 表 明 初 始 化 过 程 、 准 备 循 环 以 及 完成 过 程 的 开销 为 80-84 个 周期 加 上 每 个 元 
隶 3.5 或 40 周 期 的 线性 因子 。 对 于 较 大 的 闫 的 值 (比如 说 ， 大 于 50)， 运 行 时 间 就 会 主要 由 线性 因子 
来 决定 。 我 们 称 这 些 项 中 的 系数 为 硒 元 素 的 周期 数 【简称 CPE) 的 有 效 数 。 注 意 ， 我 们 更 愿意 用 每 个 
元 素 的 周期 数 而 不 是 每 次 循 永 的 周期 数 来 度量 ,这 是 因为 像 循 环 展开 这 样 的 技术 使 得 我 们 能 够 用 较 少 
的 种 环 完成 计算 ， 而 我 们 最 终 关 心 的 是 ， 对 于 给 定 的 向 量 长 度 ， 程 序 运行 的 速度 如 何 ， 我 们 将 精力 集 
中 在 减 小 我 们 计算 的 CPE 上 。 根 据 这 种 度量 标准 ，vsum2 的 CPE 为 3.5， 优 于 CPE Ж 4.0 ËJ Ysuml。 


code/opi/vsum.c 


J void vsumiíint n) 

à Í 

3 int i; 

d 

5 for [1 = 0; i < n; l++) 
Б cli] = afi] + bli]; 
7 ] 

8 


І ЖЕРІНЕ AARRE, — 
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9 /* Sum vector of n elements (n must be even) */ 
10 void vsumziint n) 


11 i1 

12 int 1; 

13 

14 tor (1 = Ü; i < n; із-2) { 

15 /* Compute two elements per iteration */ 
16 c[i] = ali] + blil; 

17 c[i+1] = а[1+1] + BlIi+l]; 
18 ) 

13 | 


code/opt/vsum.c 


图 5.1 向 量 求 各 函数 
这 是 基于 我 们 如 何 表示 得 序 心 能 的 示例 ， 


1000 -— -~ 


900 


$0 和 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 


w auml 


700 +————— — Siopa = 40 一 一 一 一 


o4 
m 600 a 
ke 


” КАТУ; 
— ME —— 
EE 500 Slope = 3.5 


Ü 50 100 150 200 
元 素数 
图 5.2 ”向量 求 和 函数 的 性 能 
НЕН ЈА ЩА (CPE), 
Xi. ARE СЕЛА? 

对 于 一 个 数据 点 (六 (pn 00 es, ВЕЧАН а RAS ЖАНЕТ ЖА Ж 
的 越 势 使 用 最 小 二 冬 方 拟 合 ， 我 们 寻找 -一 条 形 如 ?= mr + 5 的 线 ， 人 局 得 下 面 这 个 误差 度量 最 小 ; 
E(mb) = Y (muy +b- у) 
іл 


ЖЯ m b 5 XT EGRE ERR] Кт, b) XT. m Ж b ЕЕ. 


练习 题 5.2 
在 本 章 后 面 ， 我 们 会 采用 一 个 函数 ， 生 成 许多 不 同 的 变种 ， 这 些 变 种 保持 未 数 的 行为 ， 又 具有 
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不 同 的 性 能 特性 。 对 于 其 中 三 个 变种 ， 我 们 发 现 运 行 时 间 (用 时 和 钟 周 期 表示 ) 可 以 用 下 面 的 函数 近 
(DU Rr TF: 

版 本 1 604355 

版 本 2 136-4n 

版 本 3 15741.25n 

每 个 版 本 在 取 什 么 慎 时 是 三 个 版 本 中 最 快 的 ? 记性 ， 上 总 是 整数 


5.3 程序 示例 


为 了 说 表 一 个 抽象 的 程序 是 如 何 被 系统 地 转换 成 更 有 效 的 代码 的 ， 考 虑 图 5.3 所 示 的 简单 向 量 
ЖАКЫН. php ERREUR. ODE РЕШШ PEST 


code/apt'vec.h 
1 Ё Create abstract data type for vector */ 
2 typedei struct { 
3 int len; 
4 data t *data; 
5 y vec rec, *vec ptr; 
code/or/vec.h 


елаз | 0 12 length-t 
ва еә [I] [7] 


图 5.3 向量 的 抽象 数据 类 型 
| ШЖ {БЛП Чп ЕЛІМ Ж л. 
这 个 声明 用 数据 类 型 data t 作为 基本 元 素 的 数据 类 型 。 在 我 人 的 评价 中 ， 我 们 产量 我 们 的 代码 
对 于 数据 类 型 int, Пош 和 double 的 性 能 。 为 此 ， 我 们 会 分 别 为 不 同 的 类 型 声明 编译 和 运行 程序 ， 
ҚИЯ FEAT TI +F: 
typedef int data t; 


除了 头 以 外 ， 我 们 还 会 分 如一 -个 len 个 data t 类 型 对 象 的 数组 ， 来 存放 实际 的 向 量 元 素 。 

图 5.4 给 出 的 是 一 些 生成 向 量 、 访 句 问 量 元 素 以 及 确定 问 基 长 度 的 基本 过 程 。 一 个 值得 注意 的 
Ж КНН ЛЕ get_vec_element， 向 量 访 补 程 序 会 对 每 个 向 量 引用 进行 边界 检查 。 这 段 代 人 码 类 似 于 许多 
Kin (H Jaa) 所 使 用 的 数组 表示 法 。 边 界 检查 降低 了 程序 出 错 的 机 率 ， 但 是 正如 我 们 看 到 
的 那样 ， 它 孔明 显影 响 了 程序 性 能 。 

ЖАЗА, ЕЕ 5.5 中 所 水 的 代码 ， 它 根据 某 种 运算 ， 将 -个 向 量 中 所 有 的 元 素 合 
并 ccombining) 成 一 个 但 。 通 过 使 用 编 详 时 常数 DENT 和 OPER 的 不 同 定 义 ， 这 绩 代 码 可 以 重 纺 
埋 成 对 数据 执行 不 同 的 运算 。 特 别 地 ， 使 用 声明 ， 

«define IDENT 0 

#define OPER + 

кш ЖЖ. ФЕ PH: 


*define IDENT 1 
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fdefine OPER * 

A EE EIC АЧА, 

作为 一 个 起 点 ， 下 面 是 combinel 的 CPE 度量 值 ， 它 运行 在 Intel PentiumlII Б, 23 ES 
型 和 合并 运算 物 所 有 组 合 。 在 我 们 的 度量 值 中 ， 我 们 发 现 单 、 双 精度 浮 点 数据 的 时 和 间 基 本 上 是 相等 
的 。 因 此 ， 我 们 只 给 出 对 单 精度 浮 点 数据 的 度量 值 。 


а 


Combinel 320 Umm m 42.06 41.86 41,44 160.00 
Combinel 320 ШЖ (i-02 31.25 33,25 3125 143.00 





- code/opt/vec.c 
1  f*Üreate vector of specified length * 
2 vec ptr лем vecí(int len) 
3 i 
4 /* allocate header structure */ 
5 vec ptr result = (чес ріг) maliocí(sizeofí(vec гес\}; 
z if (!result| 
7 return NULL: /* Couldm' tallocate storage */ 
B result-»len = ler; 
9 /* Allocate array */ 
10 if (len > 0) 1 
11 data t *data = (бага t *)callocilen, sizeof(data t!); 
12 1f ('data) í 
13 free((void *) result); 
14 retarn NULL; /* Сошап tallocate storage */ 
15 } 
16 resalt-+đdata = data; 
17 } 
18 e se 
19 resu]t-»data = NULL; 
20 return result; 
21007) 
22 
23 /+ 


24 * Retrieve vector element and store at dest. 

25 * Return 0 (out of bounds) or ! (successful) 

26 */ 

27 int get vec element(vec ptr v, int index, data t *dest) 
28 { 


28 if (index < 0 || index >= v-»len) 
30 return 0; 

31 *dest = v-»data[index]: 

32 return 1; 

33 1 

34 


35 /* Return length of vector */ 
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36 int vec length(vec ptr vj 


37 { 
iH returr v-»len; 
39 | 
code/opt/vec.c 
图 54 向 量 拍 象 数据 类 型 的 实现 
在 实际 程序 中 ， 数 据 类 型 data t 被 出 时 为 nt. float 或 double, 
code/opt/combine.c 
1  /f*Implementation with maximum use of data abstraction */ 
2 void cembinelivec ptr v, data t *dest) 
3 { 
4 int i; 
5 
5 *dest - IDENT; 
7 for [i = 0: i < vec length(v]; ін) f 
8 data t val; 
9 get vec elementiv, i, eval); 
10 *dest = *dest OPER val; 
11 } 
12 1 
code/opvcombine.c 


图 5.5 合并 操作 的 初始 实现 
使 用 标识 元 素 DENT 和 合并 运算 OPER 的 不 同 声明 ， 我 们 可 以 测量 该 甬 数 对 不 同 运算 的 性 能 ， 


濮 认 地 ， 编 译 器 产生 适合 于 用 符号 调试 器 - - 步 -步调 试 的 代码 。 因 为 日 的 是 使 日 标 民 码 尽 可 能 
类 似 于 源 代码 中 表明 的 计算 ， 所 以 几乎 没有 进行 什么 优化 。 简 单 地 将 命令 行 开关 设置 为 “-O2”， 我 
们 万 能 进行 优化 了 。 正 如 看 到 的 那样 ， 这 显著 地 提高 了 程序 性 能 。 通 常 ， 荞 成 进行 这 一 级 优化 的 习 
惯 羡 很 好 的 ， 队 在岗 译 程 序 奈 是 为 了 要 调试 它 。 对 于 我 们 剩 下 的 度量 ， 我 们 都 进行 了 这 一 级 别 的 编 
ЙИ. 

还 要 注意 ， 除 了 浮 点 数 乘 法 以 外 ， 对 于 各 种 数据 类 型 和 不 同 运算 的 时 间 基 本 上 都 是 同等 的 。 浮 
太 数 眉 法 有 很 高 的 时 钟 周期 数 是 由 于 我 们 基准 程序 数据 中 的 异常 。 找 出 这 样 的 异常 是 福 能 分 析 和 优 
化 的 一 个 重要 组 成 部 分 。 我 们 会 在 5.11.1 节 中 回 过 来 讨论 这 个 问题 。 我 们 会 看 到 可 以 大 幅度 地 提高 
它 的 性 能 ， 


5.4 消除 循环 的 低 效 率 


可 以 观察 到 ， 过 程 combinel i8 P3: уес length 作为 for 循环 的 测试 条 忻 ， 如 图 5.5 Erg. nj 
想 一 -下 我 们 对 箱 环 的 讨论 ， 每 次 循环 达 代 时 都 必须 对 测试 条 件 求 伪 。 另 -方面 ， 向 量 的 长 度 并 不 会 
随 者 符 环 的 进行 而 改变 。 因 此 ， 我 们 只 需 计算 一 次 向 量 的 长 度 ， 然 后 在 我 们 的 测试 条 尾 中 使 用 这 个 
Їй. 

图 5.6 给 出 的 是 -个 修改 的 版 本 ， 称 为 combine2， 它 在 开始 时 调用 vec_Iength， 并 将 结果 赋值 
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ARE length. ЖОН, ЯҒ for 循环 的 测试 条 件 中 使 用 这 个 局 部 变量 令 人 惊 育 的 基 ， 这 个 小 小 的 
民 动 明显 见 影 隐 了 程序 性 能 。 如 下 表 所 示 ， 通 过 这 个 简单 的 变换 ， 我 们 为 每 个 自重 元 素 消 除了 上 人 概 
10 个 时 钟 周期 。 


一 
E 数 m 5 法 
сою ле] 329 3 05-02 —— 33.25 31.25 143.00 
combine2 330 | 5) vec length 2261 2125 21.15 135.00 
图 56 改进 循环 测试 的 效率 
通过 把 对 vec length ПЕНЕН НЯ, РВЕ МЕ НЕТ ЕК Г. 














=——. code/opiecombine.c 
/* Move call to vec length out of loop */ 


1 

2 void combine2(vec ptr v, data і *dest! 
3 { 

4 int 1; 

5 int length = мес length(v); 

5 

7 *dest - IDENT; 

B сог {1 = D; 1 < length; i++} { 

a data t val; 

10 get vec e ementiv, i, буа); 
11 *dest = *dest OPER val; 

12 i 

13  ] 


A 


coderanveombine.e 


这 个 优化 是 ”类 常见 的 、 称 为 代码 移动 (code motion) 的 优化 实例 ， 这 类 优化 包括 襄 别 出 要 鼎 
行 儿 次 (例如 ， 在 福 环 里 ) 但 是 计算 结果 不 会 改变 的 计算 ， 因 而 我 们 可 以 将 计算 移动 到 代码 前 面 的 ， 
DRR 多 次 求 值 的 部 分 。 在 本 例 中 ， 我 们 将 对 vec length 59 FR ДА £6 A ЖАН УВА, 

估 化 编译 器 会 试 葫 进 行 代码 移动 。 不 幸 的 是 ， 就 像 前 面 讨论 过 的 孝 样 ， 对 于 会 改变 在 哪 蛙 调用 
ЖӘНЕН Ж АН, АЙДЫНЫ БІРМЕН 个 函数 是 否 会 有 副作用 ， 
因而 它们 会 假设 识 数 会 有 有 副作用, 例如 ， 如 果 vec lengih 8 ЖЯ EH, 那么 combinel 和 combine? 
可 能 加 会 有 不 同 的 行为 。 在 这 样 的 情况 中 ， 程 序 员 必 须 帮 助 编 详 器 显 式 地 完成 代 公 的 移动 ， 

IEA combine) 中 看 到 鸭 入 环 低 效 率 的 -- 个 极端 例子 ， 考 在 图 5.7 中 所 未 的 过 程 jowerl。 这 个 过 
香 走 模仿 几 个 学 生 的 滑 数 设计 ， 他 们 的 消 数 是 作为 一 个 网 络 编 程 项 目的 一 部 分 提交 的 。 这 个 过 程 的 
ПИШЕ 一 个 字符 只 中 所 有 大 写 宁 和 母 转换 成 小 写字 每 。 这 个 过 程 一 步 GbR B EU. HERBA 
二 宁 符 转换 成 小 与 宁 符 。 


ч 


code/opt/lower.c 
1 Ж Convert string to lower case: slow */ 


2 void lowerlí(char *5) 
3 { 
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4 int 1; 

5 

6 for {i = Ü; i < strlenis); i++} 

7 if (=[11 >= "А! && s[i] <= '£') 
8 s[i] -= ('A' - 'a'); 

9 } 

lü 


11 А Convert string to lower case: faster */ 
12 void 1омег2 (сһаг *s) 

13 £ 

14 int 1; 

15 int len = strlenis); 


17 for {i = 0; i < len; i++} 

16 if (ӘНІ >= 'A' && s[i] <= 'Z') 
15 s[i] -= {СА' - 'а'); 

20 } 


22 此 Implementation of library function strlen */ 
23  /* Compute length of string */ 
24 size t strleníconst char *s! 


25 1 
26 int length = 3; 
2 while ;*s із '\0'} 1 
28 Stt; 
28 length++; 
ЕШ l 
31 return length; 
32 ] 
code/opvtower.c 
图 5.” 小 写字 母 转换 函数 
两 个 过 程 的 性 能 兰 别 很 大 ， 


调用 库 过 程 strlen (Е Jj lowerl 的 循环 测试 的 一 部 分 .区 5.7 中 也 给 出 了 ишеп 的 一 个 篇 单 的 版 本 。 
因为 C 中 字符 串 是 以 null 结尾 的 字符 序列 ，strlen 必须 一 步 一 步 地 检查 这 个 序列 ， 上 自 到 沁 到 null = 
符 。 对 于 一 个 长 度 为 n 的 字符 吕 ，strlen 所 用 的 时 间 与 ЖІБЕ. Ж өзен Wn kak — 
次 部 会 调用 sirlen, ВТ) lowerl 的 整体 运行 时 和 间 是 字符 串 长 度 的 二 次 项 。 
如 图 5.8 所 示 ， 这 个 过 程 对 各 种 长 度 的 字符 串 的 实际 测量 值 验证 了 上 述 分 析 。lowerl 的 运行 时 
间 曲 线 图 随 着 字符 串 长 度 的 增加 上 升 得 很 陡峭 。 访 图 的 下 部 展示 了 八 个 不 同 长 度 字 符 串 的 适 行 时 间 
(与 曲线 图 中 所 示 的 有 所 不 同 )， 每 个 长 度 都 是 2 MRA URRE), ЕР lowerl ЖШ, ТИН 
长 度 每 增加 一 倍 ， 运 行 时 间 都 会 变 为 原来 的 四 倍 。 这 很 明显 地 表明 复杂 度 是 二 次 的 。 对 于 一 个 长 度 
为 262144 FFR, lowerl ЖЕЖ 3.1 分 钟 CPU 时 间 ， 
除了 我 们 把 对 strlen 的 调用 移出 了 循环 以 外 ， 图 5.7 ФТ lower 5 lower] 是 一 样 的 。 这 样 
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一 来 , 性 能 有 了 显著 改善 ,对 于 一 个 长 度 为 262144 的 字符 串 ， XI Bg И 0,006 种 一 一 比 ірмегі 
快 了 30000 в. ОЕ 长 度 每 增加 一 倍 ， 运 行 时 间 也 会 增加 - 信 一 -很 显然 复杂 上 庶 是 线性 的 。 对 
本 较 长 的 字符 器 ， 运 行 导 间 的 改进 会 惠 人 人。 

(ЕНА, ВЕ ТА Н АИА ТУТ strlen 的 每 次 调用 都 会 返回 相同 的 结 黑 ， 因 此 应 
沪 能 够 把 这 个 调用 移出 循 处 。 这 需要 非常 成 熟 完善 的 分 析 ， 因 为 strlen 会 检 但 学 符 串 的 元 素 ， 而 随 
Ж. lowerl 的 进行 ， 这 些 值 会 吏 变 。 编 详 顺 需 要 探查 ， 即 使 字符 串 中 的 字符 发 生 了 改变 ， 们 吓 没 有 字 
符 会 从 非 零 变 为 零 ， 或 是 及 过 米 ， 从 鹤 变 为 非 零 ， 这 拌 的 分 析 远 远 超出 了 汗 使 是 最 有 野心 的 编译 器 
的 能 力 ， 所 以 程序 员 必 须 自 己 进行 这 样 的 变换 。 


250 4 -一 一 -一 一 一 - Lá les 








0 50,000 100,000 150,000 200,000 250,000 
FARKE 


65 536 31 072 
lowerl . 12.75 51.01 
lowerz . 0.0016 0.0031 
58 /WETRBHEISEUBISTEREEERE 
FIT ERES PIS AERE LESE, 原来 的 lowerl 的 代码 具 有 .次 浙 近 (asymptotic) 复杂 性 由 上 故 过 的 ,ower? 的 代码 有 线性 的 复杂 度 ， 


这 个 小 例 说 明了 编程 时 一 个 常见 的 问题 ， 一 个 看 上 去 无 足 轻 重 的 代码 片断 有 隐藏 的 渐 近 低 效 率 
(asymptotic inefficiency )。 人 们 可 不 希望 一 个 小 写字 和 母 转换 时 数 成 为 程序 虱 能 的 限制 因素 。 通 党 ， 
会 仕 小 数据 集 上 测试 和 分 析 程 序 ， 对 此 ，lowerl 的 忻 能 荐 是 够 的 。 不 过 ， 当 程序 最 终 部 署 好 以 后 ， 
过 笠 宛 全 可 能 被 应 用 到 - -个 有 100 万 个 空 符 的 串 上 ， 对 此 ,lowerl 从 类 至 尾 会 需 费 | 个 小 时 的 CPU 
BB]. QUA. ХЕЛЕН ЖШ Т CEER. MERTA. owr 会 在 1 ЖУ РУ 
网。 人 型 狂 粒 项 目 中 会 出 芭 这 样 的 问题 ， 这 样 的 故 吾 比 比 篆 是 。 一 个 有 经 验 的 程序 员工 作 的 一 部 分 
ШАМАДАН. 


1 21H 5.3 
考虑 下 面 的 函数 ， 


int mintint x, 1п- y) { return X < y ? x : yi ] 
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int max(int x, int y) { return X « y ? y : x: ] 
void incríint *xp, int v] { *xp += V; ] 
int square(int x) ( return x*x; } 


下 面 三 个 代码 片断 调用 这 些 函 教 : 


А. for (1 = тїг{х, ү); i < maxíix, у); incrí&i, 1)) 
t += squareíi?; 

B. fcr (i = max(x, y) - l; i >= minix, y); incrí(&i, -1)) 
t += square[i); 

C. irt low = miníx, ү); 


int high = maxix, y): 


for {1 = low; 1 < high; incri&i, 1)! 
t += вараге(1); 


Бх 等 于 10, m у SET 100. 填写 下 表 ， 指 出 在 代码 片断 A— C 中 四 个 函数 每 个 被 调用 的 次 数 。 





5.5 减少 过 程 调用 


像 我 们 看 到 过 的 那样 ， 过 程 调用 会 带 来 相当 大 的 开销 ， 而 且 妨 得 大 多 数 形式 的 程序 优化 。 从 
combine? 的 代码 《图 5.60 中 我 们 可 以 看 出 ， 每 次 循环 碗 民 部 会 调用 get vec, element 来 获取 于 一 个 
阿 量 元 素 。 这 个 过 程 开销 特别 大 ， 因 为 它 要 进行 边界 检查 。 在 处 理 任 意 的 数组 访问 时 ， 边 界 检查 可 
能 是 信和 恨 有 用 的 特性 ， 但 是 对 combine? 的 代码 稻 简 单 的 分 析 ， 表 明 所 有 的 引用 都 是 可 以 避免 的 。 

作为 蔡 代 ， 我 们 假设 为 我 们 的 抽象 数据 类 型 增加 一 个 函数 getvec_start。 这 个 函数 返回 数组 的 
起 始 地 址 ， 如 图 5.9 所 本 。 然 后 我 们 就 能 写 出 此 图 中 combines 所 示 的 过 程 ， 其 中 的 循环 里 没有 函数 
调用 。 它 没有 用 函数 调用 来 获取 每 个 向 量 元 素 ， 而 是 真 接 访 问 数 级 。 一 个 纯粹 主义 者 可 能 会 说 这 种 
变换 严重 地 皖 害 了 程序 的 模块 性 。 通常， 向 量 抽象 数据 类 型 的 使 用 者 甚至 不 应 该 需要 知道 向 量 的 内 
容 是 作为 数组 来 存储 的 ， 而 不 是 作为 诸如 链表 之 类 的 某 种 其 他 数据 结构 来 在 楼 的 。 比 较 实 际 的 程序 
员 会 根据 下 面 的 实验 结果 ， 说 明 这 种 变换 的 优点 ; 


JEN 
E zl vec length 7066 21.25 21.15 135.00 
BEEN Л [д] 8.00 117.00 


1 data t *get vec start(vec ptr v) 
2 { 











combine2 


combinei 


code/opyvec.c 
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3 reLurn v-»data; 
4 | 
一 -一 一 一 一 code/opt/vec.c 
-一 code/opt/combine.c 
1 /* Direct access to vector data */ 
2 void combireiivec ptr v, data t *dest) 
3 | 
4 int 1; 
5 int length = vec lengthivj; 
6 data t *data = get vec startiv): 
j 
Я *dest = ТПЕМТ; 
9 for [1 = Ü; i < length; i++) | 
10 *dest = *dest OPER datalil; 
11 } 
12 ! 


code/apt/combine.c 


图 5.9 消除 循环 中 的 函数 调用 
ннат ыны, ме Er КН. 


改进 最 高 可 以 达 旬 3.SX. РЕВЕ АНЕ, A TRR, UB DAR SS - bi rh 
Еж. Я О EROR, HR 6x] PERITI AE HET И ЖЫ ЕНІН ПЧ. 


X. ЖЙНЕЕ 

£ TF ЮЖ K 052 AREN d Told/Inew tb Vo , ik % Told 是 原始 版 本 所 需 的 时 间 , 而 Tnew 
是 眉 改 过 的 版 本 所 需 的 了 时间。 如 果 发 生 了 实际 的 改进 ， 它 应 该 是 一 个 大 于 1.0 ЖТ. ЗЕЕ 
“X” 来 表示 这 样 一 种 比率 ， 因 于 “3.5X” 读 作 “3.5 87, 

更 加 传统 的 表示 相对 变化 的 方法 是 形 分 比 ， 在 变化 很 小 时 ， 还 是 很 有 效 的 ， 悍 是 它 的 定义 十 分 
ФА. CELER, 100(То4-ТпеюуКпез. 354 100«(Told- TnewY Told, ЖЛ ПЕН 2:2 此 外 ， 对 于 


КАЖЫ, ЕНЖЖАЛ ҒЫТ. W “ЕЕ Т 250%” ОНЕЗИ 3.5 要 更 难 
以 理解 一 些 ， 


5.6 ”消除 不 必要 的 存储 器 引用 


combine3 的 代码 将 合并 操作 计算 的 值 皖 积 在 指针 dest 指定 的 位 置 , 通过 检查 被 编 谋 的 循环 产生 
的 汇编 代 色 ， 整 数 作为 数 绢 类 型 ， 乘 法 作为 合并 弗 作 ， 可 以 看 出 这 休 晶 性 ， 在 这 段 代码 中 ， 寄 存 器 
Фесх 指向 data, Фейх 包含 1 的 值 ， 而 免 edj 指向 dest. 


сөтбіпед: type-iNT, ОРЕК = * 
dest in "cedi, data in Фесх, i in Фейх, length in hesi 


` .L18: loop: 

2 movl (Жейі!,%еах Read "dest 

3 imull (*ecx,*edx,4),$eax Muitiply Бу data[i] 
4 movl €eax,í($*edi) Write *dest 

5 incl %ейх i++ 
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6 cmpl %есі,Фейх Compare i:length 

7 jl .118 If <, goto loop 

指令 2 读 取 存 放 在 асы 中 的 值 ， 指 令 4 写 回 这 个 位 置 。 这 看 上 去 是 种 浪费 ， 因 为 正常 情况 下 ， 
下 一 次 过 代 时 指令 2 读 取 的 值 会 是 刚刚 写 回 的 那个 值 。 

这 加 导致 了 图 5.10 中 combine4 所 汞 的 做 化 ， 丰 这里， 我 们 引入 了 一 个 临时 变量 x， 它 用 在 循环 
中 存放 计算 出 来 的 值 。 只 有 在 循环 完成 之 后 结果 才 存 放 在 *dest Н. 正如 下 面 的 汇编 代码 所 示 ， 编 译 器 
现在 叮 以 用 寄存 器 综 eax 保存 累积 值 。 与 combine3 的 循环 相 比 ， 我 们 将 每 次 渤 代 的 存储 器 操作 从 两 次 
谈 和 一 次 马 减 少 到 只 需要 一 次 读 。 害 存 器 免 ecx Moed: 的 使 用 和 前 面 一 样 ， 但 是 不 再 需要 引用 *#dest。 


combined: typezINT, OPER = * 
data in eax, x in %есх, i in Фғах, length in Фесі 





1 .L24: loop: 
2 imull (%еах,%едх,4),%есх Multiply x by даа] 
3 incl $edx ++ 
à cmpl %esi,%edx Compare i'length 
5 il .L24 If <, goto loop 
code/opt/combine.c 
1 /* Accumulate result in local variable */ 
2 void combined(vec ptr v, даба t *dest| 
3 { 
4 int 1; 
5 int length = vec, length(v); 
Б Пата t *data = get vec start(v): 
7 dara t x = IDENT; 
8 
9 *dest = IDENT; 
190 for (i = 0; i < length; i++) Í 
11 X = х OPER datal[il; 
12 } 
13 *dest = x; 
14 } 
code/opt/combine.c 


E 5.10 在 临时 变量 中 存放 结果 
这 使得 每 次 循环 选 代 中 不 则 需要 读 和 写 中 间 信 。 


我 们 看 到 程序 性 能 有 了 显著 的 改善 ， 如 下 表 所 示 : 


conbinei зы 
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下 降 最 快 的 是 浮 点 数 冬 法 的 时 间 。 它 的 时 间 变 得 和 其 他 数据 类 型 和 操作 的 组 全 所 用 时 间 可 比较 
了 。 我 们 会 在 5.11.1 小 节 中 检查 这 种 迅速 下 降 的 永国 ， 
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"| BË X А B ERR ICA BERE В ӘЛЕ А 5.9 中 所 示 的 combine3 的 代码 转换 为 在 寄 行 器 中 存 
ШЇЇ ЧӨ. ӘЛЕН 5.10 中 所 本 的 combined 的 代码 所 做 的 那样 。 

然而 垂 各 上 ， 由 十 存 桂 器 别名 的 使 用 ， 两 个 毅 数 可 能 会 有 不 同 的 行为 。 例 如 ， 着 虚 整 数 数 据 ， 
运 生 为 来 法 ， 标 识 元 素 为 Қ. v 是 一 个 由 三 个 元 素 |2, 3, 引 维 成 的 癌 车 ， 考 虚 КТА Р ЖП 
H: 


coumbine3ív, get vec startí(v) + 2); 
combined(v, get vec startí(v) + 2): 


taie. ЇЧЕН ЕҢ Т ЖЕЙК НЕЛЕ NU. MA, NT 


前 БЕНЕН БЕНЕН БЕГЕН БЕГЕН 

12. 3, 5] - " 15] [2. 3, 5] (2, 3, 30] 

ПОЛНЫЙ), combine3 ЕТКЕН Б Rs AAA ПЫН EEA 
Бп 0. АҚ, ЖАНКА І, ЖЯБИЖ2-1-2, ЖАИ 3:226. RAWIS 
代 中 ， 这 个 值 会 乘 以 它 白 己 ， 得 到 最 后 结果 36。 对 于 combined 的 情况 来 说 ， 直 到 最 后 向 量 都 保持 
小 这， 结束 之 前 ， 最 后 一 个 元 素 会 被 设置 为 计算 出 来 的 值 1 .2.3.5= 30. 

HAR. RIRH combine3 和 combines 之 间 兰 别 的 例子 是 人 为 设计 的 。 有 人 会 说 combine 的 行 
为 更 加 符合 所 数 描述 的 意图 不幸 的 是 ， 优 化 编译 器 不 能 判断 函数 会 在 什么 情况 下 锌 调用 ， 以 及 称 
序 员 的 本 意 呈 能 是 什么 。 取 而 伐 之 的 是 ， 存 编译 combine3 А, 编译 器 有 责任 保持 它 -的 起 能 ， 妈 使 这 
野味 者 秆 成 低 效 率 的 代码 















combirei [2. 3, 5] 
comblre4 [2 3, 5] 





5.7 ”理解 现代 处 理 器 


公 日 前 为 止 ， 我 们 运用 的 优化 部 不 依赖 :日 标 机 器 的 在 何 特性 。 这 些 优化 只 是 简单 地 降低 了 过 
程 调用 此 并 销 ， 以 及 消除 了 一 些 重大 的 “妨碍 优化 的 因素 ”， 这 些 因 素 会 给 优化 编 详 器 造成 困难 。 须 
者 我 们 试图 进 “ 步 提高 性 能 ， 我 们 必须 开始 考虑 这 样 的 优化 ， 它 们 更 多 地 利用 处 理 器 执行 指令 的 方 
式 和 某 些 处 理 器 的 能 尹 。 监 想 获得 最 大 的 性 能 ， 需 要 仔细 地 分 析 程 序 ， 同 时 代码 的 后 成 也 要 针对 日 
标 处 理 器 进行 调整 。 尽管 如 此 ， 我 们 还 是 能 够 运用 一 些 基本 的 优化 ， 在 很 大 -类 处 童 器 土产 生 整 体 
的 性 能 提 疝 。 我 们 在 这 里 公布 的 详细 性 能 结果 ， 对 其 他 机 器 不 一 定 也 有 同样 的 效果 ， 伯 是 操作 和 优 
化 的 道 用 原则 对 范围 众多 的 机 器 都 适用 ， 

为 了 理解 改进 性 能 的 方法 ， 我 们 需要 一 个 关于 现代 处 王 器 是 如 何 工作 的 简单 操作 模型 。 出 十 大 
TARAR URERA “ 抉 世 片上， 纲 代 微 处 理 器 采用 了 复杂 的 硬件 ， 试 图 使 程序 性 能 最 大 化 ， 
一 个 后 果 就 是 处 理 器 的 实际 操作 与 观察 汇编 语言 程序 得 到 的 概念 人 相 径 庭 ， 在 汇编 代 公 级 ， 看 上 去 
似乎 是 次 执行 -条 指令 ， 每 条 指令 者 包括 从 寄存 器 或 存储 器 取 值 ， 执 行 -个 操作 ， 并 把 结果 存 回 
到 个 寄存 器 或 在 鱼 器 位 置 。 在 实 奈 的 处 理 器 中 ， 是 同时 对 多 条 措 令 求 值 的 。 存 某 些 设计 中 ， 订 避 
有 80 或 更 多 条 指令 在 处 理 中 。 采用 - 些 精细 的 机 制 来 确保 这 种 并 行 执行 的 行为 , 能 正好 获得 机 器 级 
程序 监 求 的 顺序 语义 模型 的 效果 。 
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571 整体 操作 

图 5.11 给 出 了 现代 向 处 理 器 的 一 个 非常 简单 化 特 示 意图 。 我 们 假设 的 处 青 器 设计 是 基于 Intel 
“РЫ” MARAH TAMA RAE Intel PentiumPro、Pentium П 和 Pentium ITI ЯН: 
Wü. МЛ Pentium. 4 的 微 体系 结构 有 和 不 同 ， 不 过 它 芍 整体 结构 与 我 们 在 这 各 讲述 的 很 类 似 。B6 
WRAAE N 20 世纪 0 年 代 后 期 以 来 许多 厂商 牛 产 的 高 端 处 理 器 的 典型 。 在 工业 漠 称 为 超标 营 
Csuperscalar)， 意 夺 是 它 可 以 存 每 个 时 钟 周期 执行 多 个 操作 ,而 凡是 乱 序 的 (out-of-order)， 意 蛋 就 
是 指令 执行 的 顺序 不 一 定 要 与 它们 在 汇编 程序 中 的 顺序 一 致 。 整 个 设计 有 两 个 证 要 部 分 : ICU 
(Instruction Control Unit， 指 令 挖 制 单元 】 和 EU (Execution Unit， 热 行 单 元 )。 朋 者 负责 从 人 存储 器 
中 读 出 指令 序列 ， 并 根据 这 些 捐 令 序 列 生成 一 组 针对 程序 数据 的 基本 操作 ， 而 后 者 执行 这 些 操作 。 





图 5.11 一 个 现代 处 理 器 的 框图 
指令 摊 制 单元 负责 从 存储 器 中 读 出 指令 ， 并 产生 - 系列 基本 操作 。 然后 执行 单元 完成 这 些 操 件 ， 以 芒 指 出 分 支 顶 测 是 否 让 靖 。 


ICU A8 4- 3) iE A45. Cinstruction cache) 中 读 取 指令 ， 指 令 高 速 缓存 是 一 个 特殊 的 总 速 缓存 
个 情 器 ， 它 包含 最 近 访 问 的 指令 。 通 常 ，ICU 会 在 当前 正在 执行 的 指令 很 早 之 前 到 指 ， 所 以 它 有 
时 够 的 时 间 对 指令 解码 ， 并 把 操作 发 送 到 EU。 不过， 有 一 个 问题 ， 那 就 是 当 程序 过 到 分 支 ' 时 ， 


1 我 们 吊 林 语 “ 分 支 ” 专 指 条 忻 转 称 指令 ， 对 处 理 器 来 说 ， 范 他 元 能 将 控制 传送 到 元 个 目的 地 址 的 指令 ， 例 如 过 程 运 加 和 间 
ЖАН, КЕЕЖИЕЯН RESO. 
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程序 有 蝎 个 可 能 的 前 进 方 向 。 一 种 二 能 会 选择 分 支 ， 控 制 被 传递 到 分 支 目标 ; 另 一 种 呀 能 是 ， 不 
ak А. Pedum НЕФ ЛЕЈН 8, ЗЛ Н Г АК 2 EAA (branch 
prediction) 的 技术 ， 在 这 种 技术 中 处 理 器 会 预测 是 否 选 抒 分 克 ， 同 时 还 预测 分 支 的 日 标 地 址 。 使 
用 “种 称 为 投机 质 行 【speculative execution). 的 技术 ， 处 夫 器 会 开始 取出 它 预 测 的 分 支 处 的 指令 
村 半 指 令 解 码 ， 其 至 于 在 它 确定 分 支 搞 测 是 否 正确 之 前 就 开始 执行 这 些 操作 。 如 果 过 后 它 桶 定 分 
六 预 测 错 误 ， 它 会 将 状态 章 新 设置 到 分 支 上 的 状态 ， 并 开始 取出 和 执行 男 一 个 方向 上 的 指令 。 一 
种 于 如 异乎 导 常 的 技术 是 开始 取出 和 执行 两 个 可 能 方向 上 的 指令 ， 随 后 表 抛 弃 掉 不 止 确 方向 上 的 
秆 未 ， 时 至 今日 ， 都 不 认为 这 种 方法 的 成 本 效率 是 值得 的 。 标 号 为 取 指 控制 的 氛 包 括 分 支 预 测 ， 
以 完成 确定 取 哇 条 指令 的 任务 。 

指令 解码 逻 租 接收 实际 的 程序 指令 ， 并 将 它们 转换 成 -组 基本 操作 。 每 个 操作 都 完 成 荣 个 简单 
的 计生 什 务 ， 例 如 两 个 数 相 加 ， 从 存 圭 器 中 读数 据 ， 战 是 向 存储 器 写 数 据 。 对 具有 复杂 指令 的 机 
m LAW ТАЗ2 处 理 器 ， 可 能 将 一 条 指令 解码 成 可 变数 量 的 操作 。 每 个 处 建 器 设计 的 详细 情况 
BARAH, HERTHA MEARE. RRE, В FIRE BS 

addl %eax, *ecx 
产生 一 个 加 法 操作 ， 而 解码 人 下面 这 个 指令 

ааа! $eax, 4 {%#едх) 


PUE LDABAE ЧЕЛА Та МЕЖЕ ЖР, AREA ЕЕ LSE 
融 %eax 中 的 从 ,向 一 个 操作 将 结 采 存 写 到 存储器。 这 种 解码 逻辑 分 解 指令 的 操作 ,实现 了 在 ЭШЕ 
门 的 硬件 单元 之 间 的 任务 分 割 。 然 后 ， 这 些 单元 可 以 并 行 志 执 行 于 法 指令 的 各 个 部 分 。 对 于 具有 简 
六 指令 的 机 器 ， 操 作 更 紧 帘 地 对 应 于 原始 的 指令 ， 

EU 接收 来 日 指令 读 取 单 元 的 操作 。 通 常 ， 它 会 每 个 时 钟 周期 接收 若 十 个 操作 。 这些 操 作 会 被 
ПІ 组 功能 单元 中 ， 它 们 会 执行 实际 的 操作 。 这 些 功 能 单元 是 专门 用 来 处 理 特定 类 坦 的 操作 ， 
EAR] GERE 5.11) НТ -组 典型 的 功能 单元 。 它 沿用 的 是 最 近 的 Intel 处 于 路 的 风格 。 图 中 的 
单元 如 下 ; 

EHAA: 执行 简 单 的 整数 操作 (加 法 、 测 试 、 比 较 、 远 辑 )。 还 处 理 分 支 ， 就 像 下 面 全 讨论 
m ДИ. 

A HEN ПАТ ЗВЕНЕ, ӘНЕ. 

FAME: АН Е IE ОН ЖЕЕ (nik. АНЕ). 

TARERE: ЖЕР л ЖЕНШДЕ. TERURAS, ИШЕ И 3 (transcendental 
fnction)， 会 被 转换 成 操作 的 序列 。 

加 载 : 处 理 从 存储 器 读数 据 人 到 处 理 器 的 操作 ， 这 个 功能 单元 有 - -个 加 法 器 来 执行 地 址 计算 。 

存储 : 处 理 从 处 理 器 到 存储 器 的 写 操作 。 这 个 功能 单元 有 -个 加 法 器 来 执行 地 址 计 管 。 

如 图 中 所 示 ， 加 载 和 存储 单元 通过 数据 高 速 缓存 访问 存储 器 ， 这 是 一 个 高 速 存储 器 ， 包 含 最 近 
访问 的 数据 值 。 

使 用 投机 执行 技术 ， 对 操作 求 信 ， 亿 是 最 终结 果 不 会 存放 在 程序 寄存 器 成 数据 存储 器 中 ， 直 到 
外 姓 咒 能 确定 诺 访 实际 执行 这 些 指令 。 分 支 操作 被 送 到 EU， 不 是 确定 分 支 该 往 哪里 去 ， 而 是 柳 定 
ж ЖЕЙ. m NAE. EU 会 丢弃 分 支点 之 后 计算 出 来 的 结果 。 它 还 会 发 信号 给 分 支 
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(c. Wo tI, УНН ЕИО X HE. Е ИН, x Rom eem eines. 
КЕННЕ ЕН КЕНЕЕН. (Ea DELEGA ЎН. MESE SIUE LT dI. STER 
-点 上 时间， 我 们 会 在 5.12 Е РЕА HB. 

在 ICU tB, EREA (Retirement Unit) ТОЙ ЕЕ ТЇ НЫН. ЕЖЕ RUE iW 
序 语义 ， 我 们 的 图 中 展示 了 一 个 青春 器 文件， 它 筷 言 整 数 和 浮 点 数 窗 存 趴 ， 是 退 各 单元 的 一 部 分 ， 
因 光 过 役 单元 控制 这 些 寄 存 器 的 更 新 。 指 令 解 码 时 ， 甘 于 指 坟 的 信息 被 放置 在 一 个 先进 殉 出 的 队列 
h. УЧЕ ВЕНЕТА ИН, ЯРАР. HX. ВВЕ ТЕЕ Т, 
ПОР ЧИ АС Б ЖЕНА НЕА. 3X Е е ИШЕ T. ЕТМЕ 
mu ar СС АС ЗА ТТ Т. HAm tm РАНИ ВОР АННА ЧА, ЖЫН 
Wd. йт ЖІ. ЖИНАЛУ. WORERNE T ATRE T. 

iE STOP mib NH. e ЕЕК ТЕВЕ 4 huu, ПП 
КЕНЕП НАН ТАТ 3 ERIM ERAT. ЖЫН. 38 TUE C HIE BILE — 3112 
fis m E. EE EEG B E Air [ШЖ]. ІНІН “НЕЕ”. Е ЕЗЕТ 
Wir ca ELA SER RUE EE. 

M WS Fr He PERPE PUT A [ЕЕ КИПЕ Е E (register renaming)。 当 一 条 
ПИ r HR MEN. FELI (tag 0， 得 到 一 个 指向 该 换 作 早 果 的 惟一 的 标识 符 。 杂 目 
in) 术 加 入 到 一 张 表 中 ， 讲 表 维 护 着 每 个 程序 寄存 冉 与 全 更 新 读 寄 存 器 的 操作 的 标记 之 间 的 甘 联 ， 
当 随 后 以 寄存 器 r TEMERE MEIN, SONRAKI Qhi TER GE EGER 
"MX THAT Buy — ҮШТЕН, 2 ER TENUIS. ЕҢЕЛ c ORE E v. ҚЫМ, Ж 
Hs г ЕЛЕЕ GERE y 作为 源 值 了。 通过 这 可 机 制 ， 值 可 以 直接 以 一 个 操作 情 递 到 另 一 
个 操作 ， 而 不 是 习 乔 寄存 器 文件 再 读 出 来 。 重 向 名 表 只 包 舍 基于 有 未 进行 写 揪 必 的 寄存 路 条 目 。 当 
一 条 已 解码 的 指令 需要 寄存 器 r， 而 又 没有 标记 与 这 个 寄存 器 相 甘 联 ， 这 涉 扒 人 必 数 可 以 直接 从 痪 存 
中 文件 中 非得 。 有 了 害 存 器 重 南 名 ， 即 使 只 有 在 处 理 喘 确定 了 分 支 结 思 之 局 才能 更 新 寄存 器 ， 也 可 
МН ЖТА ТЕНГЕ, 


BE ДАННИ 

乱 库 处 理 最 早 是 在 1964 年 Control Data 必 司 的 TETT яи. fW 3 b-F + RB] 6435 
Ейліти, dep dose 3 hiik. ЖАНЫ, HH HERO тюм HR AA 
34 dcm E. 

在 1966 Ж, IBM 首先 是 在 [BM 36091 ЕТ Leg 得 只 是 用 来 机 村 当下 指 四 кх» 25 
年 的 时 间 里 ， екі делі Rd TE Kb Е pn, ін 
1990 年 IBM 在 RS/6000 & F| L kbp ЖАД A T ik ki Ж. ЖЕНЕН} Ж Т TBM/Motorola PowerPC 
系列 的 基础 ， 典 型 代表 是 1993 年 引入 的 601, "ERA — dI ER tatiy HE. 


9.7.2 功能 单元 的 性 能 

图 5.12 BEBE Emal Pentium III 的 一 些 基本 操作 的 性 能 ， 其 他 址 再 串 也 具有 这 样 的 计时 特征 。 bi 
个 搞 作 者 是 由 两 个 周期 计数 值 来 刻画 的 ; 一 个 是 杭 行 时 间 【laiency)， 它 指明 功能 单元 完成 操 作 所 需 
要 的 总 周期 数 ; X ДЕЖ АНН A] Cissue timej， 它 指明 连 娃 的 ， 独 立 桃 作 之 间 的 局 期 束 。 执 行 时 
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辣 的 范围 从 基 本 整数 操作 的 一 个 周期 ， 到 加 载 、 存 储 、 整 数 乘 法 和 哆 常见 的 浮 点 氛 作 的 儿 个 周期 ， 
到 除法 和 其 他 复杂 操作 的 许多 个 周期 。 

ЕП 512 中 第 三 栏 所 小 ， 处 建 器 的 几 个 功能 单元 被 流 术 线 化 了 ， 这 意味 督 在 前 -一 个 操作 完成 
之 前 ， 它 们 就 可 以 开始 一 个 新 的 操作 。 发 射 时 间 指 明 一 个 单元 的 连续 操作 之 闻 的 周期 数 。 在 一 个 流 
水 线 化 的 单元 中 ， 发 射 时 间 比 执行 时 间 短 。 流 水 线 化 的 功能 单元 是 作为 一 系列 阶段 米 实 培 的 ， 每 个 
阶段 完成 操作 的 - 部分。 例如， 一 个 典型 的 浮 点 加 法 器 包含 二 个 阶段 ， 一 个 阶段 处 理 指 数值 ， 一 个 
将 小 数 相 加 ， 而 - 个 四 舍 五 入 计算 最 后 的 结果 。 拘 作 可 以 连续 地 通过 各 个 阶段 ， 而 不 是 等 符 一 个 襄 
作 完 成 后 于 开始 下 一 个 ， 上 只 有 当 要 执行 的 操作 是 连续 的 、 逐 和 辑 上 独立 的 ， 才 能 走 用 这 种 功能 。 正 如 
表明 的 那样 ， 大 多 数 单元 能 够 每 个 时 钟 周期 开始 一 个 新 的 操作 。 仪 有 的 例外 是 浮 点 乘法 器 利 两 个 除 
й, ЕАН ЗОБА РЕ А НИЈА Я, П ЧИА К А ОГ НУК. 


浮 点 除法 
ipi (BRET AN 
存储 《高 速 缓存 命中 ) 





图 5.12 Pentium IL SOR TE CEBS VERE 
Ға ARFA GARS. AB л ВЕЙ. REGA (B T mel DX iO. 


НИНЕ Ит а А-В НЕА ВЕ ло, ВИЗЕ I BUT ШШ ЕЙГЕ И 
ЛЕЕ, Е ТЧ ШЫҒАН ЕИ НАЙДИ. ИЛИИ Ls Ж 
十 这 些 单元 ,只 有 有 限 的 空间 ,所 以 CPU BIADA ЛЬ OCT ЕЕ oM iE D e B TERE. 
以 区 得 最 优 的 整体 性 能 。 设 计 者 们 评估 许多 不 同 约 基准 程序 ， 将 大 多 数 资 源 用 上 最 关键 的 操作 。 H 
图 5.12 表 只 的 那 栏 ， 在 Pentium Ш Bj Bip, BARE EH D А e ESTEE, NU 
使 需要 大 量 硬件 以 获得 低 执行 时 间 和 较 高 的 流水 线 化 程度 。 另 一 方面 ， 除 法 相对 不 太 常 用 ， 市 日 准 
以 实现 低 执行 时 间或 发 射 时 间 ， 因 此 这 些 操作 相对 而 言 比较 慢 。 


573 更 近 地 观 察 处 理 器 操作 

作为 分 析 在 现代 处 理 器 上 执行 的 机 器 级 程序 的 性 能 ， 我 们 提出 了 ЖЕРШ X K АРЫН 
述 指令 解码 器 产生 徇 操作 ， 还 有 一 种 图 形 化 的 表示 法 来 显示 功能 单元 对 操作 的 处 理 ， 这 陆 种 表示 法 
都 不 能 准确 地 表示 具体 的 、 现 实 的 处 理 器 的 实现 、 它 们 是 简单 的 方法 ， 才 助理 解 处 理 器 在 执行 程序 
时 能 够 如 何 利用 并 行 性 和 分 支 预 测 ， 

和 将 指令 副 译 成 操作 

我 们 通过 combine4 (图 5.100 来 说 明 我 们 的 表示 法 ， 它 是 到 日 前 为 止 我 们 最 快 代 码 匆 水 例 。 我 
们 只 关注 憩 环 执行 的 操作， 因为 对 很 大 的 向 归来 说 ， 这 是 性 能 的 决定 性 困 素 。 我 们 考虑 整数 数据 以 
区 以 琵 法 和 加 法 作为 合并 操作 的 情况 。 使 用 乘法 的 循环 的 编译 代码 由 四 条 指令 组 成 .在 这 个 代码 中 ， 
8.47 38 Фсах ТІЗЕНІ dara, Фейх 保存 i, Фесх 保存 x， 而 名 esi 保存 length: 
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combined: type-INT, OPER = * 
data in Фғах, x in Фесх, i in %edx, length in Wesi 


1 .Һ24: loop: 

2 imuli (%еах,%едйх,4],%есх Multiply x hy datalil 
3 incl %edx t 

4 cmpl %евї,%едх Compare i:length 

5 3l .L24 If «, goto loop 


ШАНА BAS. SPP ЖЕЛЕК UTR BIER h ла CU HERES). 3— 
KERR i T 0. ЭП ЕТИЛДИ ЕЕН TERREA: 
1,24: 
inull {%вах,%ёейх,4),%есх 












load í(t£&eax, *edx.ü, 4) 


imuil t.i, $ecx.0 





incl &edx incl $edx,Üü 






спрі Фәсі,%гіх 
jl .L24 


cmpl Феѕі, *edx.i — c.l 


il-taken cc.1 


在 我 们 的 指令 翻译 中 ， 我 们 将 乘法 指令 的 存储 器 引用 转换 成 一 条 旺 式 的 load TB, RPE JA 
仓储 器 恋 到 处 理 嚣 。 我 们 还 给 每 次 选 代 才 变化 的 值 分 配 操作 数 标 号 【operand label)， 这 些 林 号 是 寄 
存 器 重 命名 生成 的 标记 的 所 格 化 版 本 。 因 此 ， 循 环 开始 处 ， 寄 人 存 器 免 ecx 中 的 值 由 标号 名 eex.0 标识 ， 
企 更 新 后 ， 由 各 ecx,1 标识 。 这 次 远 代 与 直 次 选 代 不 变化 的 寄存 器 值 可 以 在 解码 时 直接 从 寄存 器 文件 
中 获得 。 我 们 还 引入 了 标号 .1， 来 表示 load 操作 读 取 的 、 传 送 到 imull 操作 的 值 ， 而 我 们 显 式 地 给 
由 了 操作 的 上 月 的 邮 。 因 此 ， 一 对 换 作 

load ($eax, Фейх.0, 4) — t.1 

imull t.1, %есх.0 — Засх.1 
表明 ， 处 理 器 首先 执行 一 条 load 操作 ， 用 %eax КИН (WK BTETRAR HUP ЕЕ) 循环 开 始 时 存 
ЖісФейх 中 的 值 来 计算 地 址 。 这 会 产生 一 -个 临时 值 ， 标 号 为 t.1。 然 后 ， 圈 法 操作 获取 这 个 值 和 和 牢 
环 开 中 时 和 ecx 的 便 ， 产 生 一 个 %ecx 的 新 值 。 正 如 这 个 例子 党 明 的 那样 ， 栋 认可 以 与 并 不 会 写 到 寄 
АТАУ ТЕН Т HHB E X EE, 

SE 

incl €edx,à — $edx.1 
指明 ， 增 量 操作 对 循环 开始 时 %edx HEU 1， 产 生 这 个 寄存 路 的 新 值 。 

操作 


cmpl езі, *edx.l — cc.l 


指明 ， 比 较 操 作 Cn BT ECC TP AAT) ЕН Фезі 中 的 值 (这 个 值 在 循环 中 不 会 收 变 ) 和 
A RRE pedr 的 值 。 然 后 ， 它 会 设置 标号 се 标识 的 条 忻 码 。 正 如 这 个 重子 说 明 的 那样 ， 处 
PES n] ULIS d OR ORE AERE RE USE 

最 后 ， 预 测 跳 转 指令 会 选择 分 支 。 跳 转 指 令 


zl-taken сс.1 
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检查 新 计算 出 来 的 条 件 码 的 值 《ec.1)》 АЕ ЧЕНЕ. WETE, WAER = 
ICU, «ЖЕ р 后 面 的 指令 处 开始 报 指 令 。 为 了 简化 表示 法 ， 我 们 省 略 了 所 右 关 于 可 能 的 不 转 有 
的 地 的 信息 。 实 际 上， 处 理 器 必须 记录 林 被 预测 方向 的 日 的 地 ， 这 样 -一 来 ， 在 预 笛 错误 时 ， 实 可 六 
ЖАНЕ АШАН. 

ax НЕНІҢ, RREA HS ГСИН STR UAE. ER TUE 
His nar {ЖЖЖ ФЕ ЖОНЕ ПЕЙ a НЕЕ. ШЕРТ, Www Жат nas 
地 给 标记 赋值 ， 使 之 指向 这 些 不 同 的 值 。 КИДА ЕЙ “pedi” ЖАНЫ E. THE 
"BE OE ES E FEE. 

Bur oc ЕА 

图 5.13 以 两 种 形式 展示 了 操作 : 种 是 指令 解码 器 生成 的 形式 , ЗЕ У ЖИ computation 
graph) ЖЕ. TRAPAT, ВЕКА ДЖОН, ВТЗ HER ELA RRE ТОШ. ЖЇП 
HA -RERS КИА раа OBERE ЕКИ К, FU RS CERE И {НЕ 702. [13 
1r fox. 


teda, 0 


load [%еах, %ейх,0, 4) 
imull t.l, %есх.б 


incl Фейх, 0 
стр] fesi, $&edx.1 
Ji-taken cc.1 





415.13. 整数 乘法 的 combine4 的 内 循环 第 一 次 迭代 的 乘法 操作 
存储 器 访 被 亚 式 地 转换 成 了 加 载 ， 寄 存 器 名 字 是 用 实例 号 码 《instanee number) 标记 的 。 


每 个 操作 符 方 框 的 总 虚 表 明 这 个 操作 再 要 多 少 个 周期 ， 也 就 是 这 一 种 蕊 能 的 执行 时 间 。 芷 此 ， 
整数 乘法 imull 需要 四 个 周期 ， 加 载 需要 三 个 周期 ， 而 其 他 操作 需要 一 个 周期 。 存 展示 一 个 箱 环 的 
计时 中 ， 我 们 将 块 竖 由 地 放置 ， 来 表示 操作 执行 的 时 间 ， 向 下 的 方向 表示 时 间 的 增长 。 我 们 可 以 看 
8|, 循环 的 五 个 操作 形成 了 两 个 并 行 的 链 ， 才 明 两 个 计算 序列 必须 顺序 弛 执行 。 左 边 的 链 处 理 数据 ， 
НЕМ лж, ЖЕЛЕЗЕ НАЕ. ИНАМИ Lo ЛЫ 
如 1， 然 后 拿 它 5 length ВС. ӘНЕ НА МЕНМЕН К, ДА АМЕ EAR. ТЕМ. 
MERRE ERRA Bj УР АЫ. BHS ЕА, ЖЕНИ Ж. DAE I ЛИЕВ, Ж 
АЖЕМЕНЛ {д s SER ИНЕ u, ПОХ ИА ОСУ ТЕ КОА а). ЖЕЛЕР t Um 
Вр, НЕ АО T EE Fe BRIE Ж. 

图 5.14 # H T lat hul EDANE, АЕ ТЕЕ RROA. ЗДА АКТА. ЯН 
Е, ГЕК, КЕНЕ УЫЗ. 
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load (Жеах, *edx.0, 4j 
аба! t.., Фесх.0 


incl Жейх.0 
старі €esi, Жейх.1 
jl-taken cc.I 





图 5.14 整数 加 法 的 combine4 里 面 循环 第 一 次 迭代 的 换 作 
қана ЖЕЛЕ mE AAW. 

无 限 资 源 的 操作 调度 

为 了 看 看 处 理 器 将 如 何 执 行 一 系列 的 反复 ， 普 先 设想 一 个 处 理 器 ， 它 有 无 限 多 个 功能 单元 和 完 
美的 分 支 预 铀 。 只 要 一 个 操作 的 数据 探 作 数 可 用 ， 该 操作 就 能 够 开始 执行 了 。 这 样 一 个 处 理 器 药性 
能 只 受 下 列 因 素 的 限制 ， 功 能 单元 的 执行 时 间 和 香 吐 量 ， 世 及 程序 中 的 数据 相关 性 。 图 5.15 给 出 的 
是 在 这 样 一 个 机 轿 上 整数 乘法 的 combine4 中 循环 头 二 次 选 代 的 计算 图 .对 每 次 先生 ， 痢 有 一 组 五 个 
操作 ， 形 式 与 图 5.13 中 所 示 的 一 样 ， 而 操作 数 标 号 有 适当 的 变化 。 从 一 次 迭代 的 操作 数 到 另 — Wik 
代 的 操作 数 的 得 头 表 羽 了 各 个 选 代 之 间 的 数据 相关 ， 

ЇЙ ҮН ЕН Ей Хх -限制 条 件 ， 每 个 操作 都 坚 直 地 放 在 尽 可 能 高 的 位 置 ， 因 为 朝 上 的 箭头 
表明 信息 流向 过 去 的 时 间 。 因 此 ， 只 要 前 一 次 送 代 的 incl 操作 产生 了 循环 索引 Coop index) 的 更 新 
ЇЕ, КЖ) load 操作 就 能 够 开始 了 。 

这 个 汁 算 图 展示 了 执行 单元 对 操作 的 并 行 执行 。 每 个 周期 中 ， 图 上 一 条 水 平 线 上 的 所 有 拘 作 是 
并 行 执行 的 。 这 个 图 还 展示 了 乱 序 和 投机 执行 。 例 如 ， 一 次 选 代 中 的 incl BRE BI Dose j! TE 
令 开始 之 前 就 执行 了 。 我 们 还 能 看 到 流水 线 化 的 效果 。 每 次 选民 从 头 至 尾 至 少 需要 七 个 周期 ， 但 是 
随后 的 过 代 每 四 个 周期 就 能 完成 。 因 此 ， 有 效 处 理 频率 是 每 四 周期 一 次 述 代 ，CPE 为 40. 

素数 乘法 四 个 周期 的 执行 时 间 限 制 了 处 理 器 对 这 个 程序 的 性 能 。 每 个 imull 操作 必须 等 待 自 到 
前 - 个 换 作 完成 ， 因 为 在 开始 之 前 ， 它 需要 这 次 乘法 的 结果 。 在 我 们 的 图 中 ， 乘 法 换 作 在 周期 4、8 
和 12 上 开 妈 。 在 随后 的 渤 代 中 ， 每 四 个 周期 开始 一 条 新 的 乘法 。 

图 5.16 展示 了 在 一 个 有 无 限 亏 个 鳃 能 单元 的 机 器 上 上 ， 整 数 加 法 的 combined. 的 头 四 次 只 代 。 如 
未 合并 操作 只 需要 一 个 周期 ， 程 序 的 СРЕ 就 能 达到 1.0。 我 们 看 到 随 着 循环 的 进行 ， 执 行 单元 就 能 
每 个 时 钟 周 期 执行 七 个 换 作 的 -部 分 了 。 例 如, 在 周期 4 中 , 我 们 可 以 看 到 机 器 在 执行 选 代 1 的 аба, 
选 代 2、3 和 4 的 load ЖЕЛЕ. ЖЇК 2л. 3810 3 08 cmpl 以 及 和 迭代 4 B) incl, 

资源 约束 下 的 操作 调度 

当然 ，“ 个 真实 的 处 理 器 只 有 固定 数 旦 的 功能 单元 。 和 我 们 前 面 的 例子 不 同 ， 在 那些 例子 中 ， 
性 能 只 受 数据 相关 垢 和 功能 单元 的 执行 时 间 的 限制 ， 现 在 性 能 还 受 资源 约束 的 限制 。 特 别 地 ， 我 们 
的 处 理 器 只 有 两 个 单元 能 投行 整数 和 分 支 操 作 。 相 反 ， 存 图 5.15 中 ， 周 期 3 中 有 三 个 此 类 操作 在 并 
行 执行 ， 而 周期 4 中 有 四 个 在 并 行 执行 ， 

图 5.17 展示 了 在 -个 有 资源 级 昌 的 处 理 器 上 ， 整 数 乘法 的 combine4 的 操作 调度 。 我 们 假设 通 
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Rit] M oc RIA) X e poc Ee un T REDE АЕ РЕ. a RE ЕСЕНИН ИГ ENTE 
ТИТ. SERM NE 6 фта НЕ. EAEN imull Wk ЖЕЙ — + E. 

HARRER RTISPA pR H Ni Ж, ТЕЕ ТЕ ЕНТ, PC EW wA iB 
TARTE. Өш, НИЕНІ 3 h, Пт T — TERM BAUER E BI. 
VE f 2 ff] cmpl АҚ 3 Й incl. ГРЕЕ 517 ЖЇН. RET HEISE TE- T. BD i 
录 操 作 的 程序 顺序 【program order? ARRS. Bir ü dan EP ИЛЕК NIE 
АТН РНЕ. ЕНІН. 3:5 RITTER HE НЕ IE FRI IEEE ETICA RR. EE, 
ENSHE ind HE. 00925545 3 HERR FE E PPF WE H ЖИЕК 1812 Ч Е 2 Б. 类似 地， 
在 周期 4 rn. UE] ЕКІ ËJ imall RIETI БЕЛЕ И BIER CIE SR TEC З у inel НЕ 
ККЖ. 
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图 5.13 ЗАТ НАСТ, SER ARENA 
ЕТЕТ Ту 
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АГАТ Г ЖЯ. Spy c E M RTI FI OM. PEREIAR ЕЕЕ ЖЕШ 
V] AA dr Hd fn] BRL SH ( 

АГ ПЕН. ЖР Н gt e ET ВАРЕНЕ ВЕ. ЖЕКЕ {КШ me УНЕ. 
ЦИЯ Ф co ERE ME. ІНЕН, ЕТЕШ ИЕНЕН К PCT P IN А ШЕ (8 E 
МЕТ. EARRA WEN combined fJ £i kit) ДЫН. АА Г ег еа зе, B s 8 Ж 
TIER 4—8 КЕШЕШ. ЖАШАТ REALE AER, PACET T Men [o ЗЕ 
(regular рет... ERR 4-8 tP, Brig MEI BUR (ПЖ ag TA a h e E 
P T FB]. ЕЖЕ ЕНТ. C47 Boi ЕЖЕ ЕИ. 因此， 我 们 每 所 个 周期 完成 四 
РЕК, ЕРНІНЕ СРЕ 2.0. 





H5l6 РЕНИ ИЕТ Т, ЫЕ 
ШЖ qd RM. ЕЕЕ СРЕ НЕҢ ІЛ. 
combined 性 能 小 站 
затен т элын 





үт 这 些 周 期 时 间 基本 上 都 与 音 间 所作 的 执行 时 间 相 符 ， 如 图 5.12 所 示 。 
(ЕАС. ЕВЕР О НЕ СРЕ (f BEC SUA TEM PERTH f D PST E 

对 于 整数 如 法 的 情况 ， 我 们 看 到 ， 有 限 数量 的 针对 分 支 和 整数 禄 作 的 动能 单元 限制 了 能 达到 的 
性 能 。 皮 次 千代 有 由 个 这 奖 操 作 ， 而 具有 丁丁 功能 单元 ， 我 们 不 能 指望 程序 能 这 行 得 比 枉 决 选 尼 2 
TARER T. 

ЕН, ДЕИН ЖЕ, 38—. Бк fec Hp ria De EE 
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MAREA WH RK. BLUE doc tE ERAT wa Г e ME 
Hau ТИМА ЕН, 8 —. ОРЫ Г ТЕЕ ЕЕЕ АТ ЕНЕ, МІНІ, 
ШЕЕ ocm EU REPE ШЕШ. KARR Bde E ТАКЕ НЕН, ELA ІСІ) 
和 EU 中 其 他 费 宰 的 限制 。 例 如， 一 个 Intel Pentium Ш ААР И H ER — dE. EI. P 
克 卦 测 壳 辑 的 成 功 恨 制 了 站 型 器 能 种 在 指令 流 中 起 前 工作 以 保持 执行 单元 第 忙 的 程度 。 拍 次 发 生 和 
MEE, НЕЛЕР КЕННЕН ЭЛЕН. 
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518 有 实际 资源 约束 的 情况 下 ， 整 数 加 法 操作 的 调度 
再 个 整数 单元 的 限制 等 性 能 的 车 在 CPE 2.0, 


5.8 降低 循环 开销 


VERE — FW R T ë E rid combined 的 性 能 , RAE, LI e mscr IET ЕЛШІСІНЕ: 
MF MER CREER НЧ, АШЕР ГАНЕ ВЕНЕ О, ЕЮ ЕНИ 
HRG 【loop index). 和 测试 循环 条 件 的 循环 开 情 的 一 部 分 ， 

拒 们 可 以 通过 在 每 次 选 代 中 执行 更 吕 的 数据 拘 作 来 减 小 循环 开 悄 的 器 哆 ， 使 用 的 是 葡 为 竹 环 展 
# (loop unrolling) 的 技术 ， RU U KE AETR RE. iX PEU NP REP ДШ 
Н РНЕ. АЛШЫН T WIE MEHR. 

ІҢ 5.19 АТН T ИТІН ЖЕНИЛ AARE, 8 Е ьан 2 
K. 也 就 是 , FAHER i НОК З, f Mdb e HERE jal Wi i 3 HET АЕН. 








code/ap/combine c 
1 X Unrall loop by 3 */ 
2 — void combine5([vec ptr v, dara t *dest) 
3 [| 
4 int length = vec length(v); 
3 int limit = length-2; 
Б data t *data = get vec startív); 


348 3: 5 * 


/ Дара L x > IDENT; 

8 int 1; 

E 

1ü #* Combine 3 elements at a time */ 

21 for (i = 0; i < limir; і--3)| í 
12 x = x ОРЕЗ datali] ОРЕВ data[i«1] OPER data[i«2]; 
13 } 

14 

15 í* Finish any remaining elements */ 

16 for i; 1 < length; i++} Í 

17 x = x OPER datali]; 

18 | 

19 *dest = x; 


MM —_ YUTcs— — Y  code/opi/combine.c 
图 5.19 展开 循环 三 次 
MAE Rt F Bei] ËH PSS, 


Ж т, ЕКЕЛГЕН, RTA BR BS IC а БОЯ ШЕШУ ЛЕ. RTIA 
两 个 坟 血 来 解决 这 个 第 求 。 首 先 要 确保 第 次 循环 不 会 趋 出 数组 的 界限 。 对 十 长 度 为 4 的 同 量 ， 我 
们 将 篇 环 限制 似 为 -2。 然 后 ， 我 们 会 保证 具有 当 御 环 索引 i 满足 i < n2 BLA ФАТА МОЯИ, 5 
此 最 人 数组 索引 ie 2 会 满 是 74+2<(n-2)+2=n, 通常 , ШЕ ЫЛЕ kuk, 我 们 就 把 CIBO n-k 
rl, ЖАНА ж о i+ k-1 会 比 问 小 。 除 此 之 让， 我 们 加 上 第 一 个 循环 ， 以 每 次 处 理 一 个 元 素 
的 方式 处 囊 同 量 的 最 后 儿 个 元 素 ， 这 个 循环 体 将 会 执行 0 一 2 Ж. 

为 了 更 好 地 弄 解 带 循环 展开 的 代码 的 性 能 , 让 我 们 来 看 看 内 循环 的 汇编 代码 和 它 到 媒 作 的 翻译 ， 


执行 单元 操作 


addl [*eax,$edüx,4],€*86cx load (£€eax, Жейх.о, 4) 


.DL48; 


addl t.la, €&ecx.üc 
addl 4[£eax,&edx,á),tecx Load 4{%еах, Зеіх.0, 4) 


addl t.lb, жесх. 1а 
addl Bíteax,*edx,4],*ecx load Bí(€$eax, %едх.б, 4) 
addl t.lc, %єсх.1Ь 
addi Фесх, 3 addl Фейх.0, 3 
cmpl #0651, €edx cmpl tesi, %егіх,1 
01.149 jl-taker сс.ї 


mms summ. МЖЖ ЛАН ЕИ ЖИНА Т ТЕРЕ, АЯЛЫ ДАМЫ 
ЖЕЛМІН Ы. TERRA, -ХЕЛЕНАПЕ ®НШ AT eU ВЕРЕ 1 
ляж, MA 5.20 Bros, ББ ЕВЕ л; xa FE, ЈЕНЕ ВЕДА Я] CPE 1.0. 图 5.21 8, 
ПДА КЗ (i= 6)， 操 作 上 就 会 遵循 ERE SUR. A4 G = 9) 的 操作 有 网 样 的 时 间 
安排 只 不 过 移动 了 三 个 周期 这 会 臭 正 得 到 CPE 1.0. 
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ПАА ӘЛМЕН CPE 为 1.33， 也 就 是 说 ， 每 次 造 代 需 要 四 个 周期 。 根 明显 ， 牧 们 在 
个 析 中 未 说 明 的 某 个 资 尊 的 东 下 组 了 计算 ， 称 次 夺 代 机密 一 个 周期 ， 扼 面 ， 比 起 未 使 用 锁 环 展开 的 
代码 ， 这 个 性 能 还 是 有 改进 的 。 


load [&gax, Wedx.D, 4) 
add] t.la, *ecx.üc 
load 4|[Weax, *edx.0, 41 
addl t.lb, *ecx.la 


load 8|&eax, *edx.ü, 4] 
addi t.lc, k*ecx.lb 
addl t&adx.ü, 1 

cmpl tasi, Wedx.1 
]1-taken сс.1 


+++ 44 





520 -хияевтамияия- ХАКАН 
ШИНЕЛЕН. АЧСА А ЕМВ Ж. 





521 НЕНИН ЖЩ ЯЛТ. -ХЕНЛІИШЕЖЕННЕРНЯЯ 
RiW F, IpTIIBENLIERCPELD E RNE SIE СРЕ % 123. 


测量 各 种 展开 程度 的 性 能 ， 得 到 如 下 的 CPE (Ñ: 


350 %5% 


展开 程度 


ІНІСІ | 


2 3 4 8 18 
2.00 1.50 1.33 1.56 1.23 1.06 


ЕХ 848 ЖЕВ ПУ. ЖЕЛЕК СРЕ. {КЕЛЕ 2]. ЕҢ ЖЕШ ОА 
MRAPA, AE СРЕ 3/2 = 1.5. FUE RIT RISE, $2 DES НЕДЕН ë af ЛЕНЕ. Ж 
近 СРЕ RH] SEE ЕШ 1.0. 1€ |P St E dF e ЖИЕН ЕЛУ: RARA 3 得 到 比 展开 度 为 4 更 
好 的 性 能 。 很 明显 ， 在 后 一 种 情况 后 ， 执 行 单元 上 操作 的 调度 效率 要 低 一 些 ， 

我 们 的 СРЕ 测量 值 不 能 解释 开销 因素 ， 例 如 程序 调用 和 准备 循环 的 开销 。 生 用 循环 展开 ， 我 们 
引入 了 一 种 新 的 开销 一 - 当 癌 鞋 长 度 不 能 被 展 间 度 整除 时 , 需要 完成 所 有 暮 下 的 元 娄 。 为 了 赋 究 开 销 
物 影 响 ， 我 们 测量 了 各 种 向 量 长 度 的 净 CPE (net CPE)。 净 CPE 是 这 样 计算 的 ， 过 程 需要 的 总 周期 
数 除 以 元素 的 个 数 ， 对 于 不 同 展开 度 和 两 个 不 同 的 向 量 长 度 ， 我 们 获得 下 面 的 数据 








Ж prp BOR. CPE 和 净 CPE HÆR AKEJ 1024 的 测量 值 就 能 看 出 来 ， 但 是 对 于 
短 问 量 玉 说， 影响 就 很 明显 ， 从 长 度 为 31 的 问 量 的 测量 值 就 能 看 出 来 。 我 们 长度 为 31 的 向 量 的 禄 
CPE 的 调 量 伸展 示 了 和 芽 环 展开 的 一 个 缺点 。 即 司 不 展开 ， 悼 CPE 4.02 比 长 问 量 测 出 的 2.06 2 AR 
多 。 轨 御 坏 执行 较 少 次 时 ， 开 始 和 完成 循环 的 开销 变 得 更 加 重要 。 另 外 ， 循 环 展开 的 好 处 就 不 邦 么 
明显 了 。 展 开 后 的 代码 必须 局 动 和 停止 两 个 循环 ， 而 且 它 必须 每 次 -- 个 地 完成 最 后 的 元 素 。 币 环 恨 
开 增加 ， 开 销 会 降低 ， 而 最 后 循环 中 执行 的 操作 数 会 增加 。 当 向 量 长 度 为 1024 hj, 性 能 通常 会 随 着 
展 半 度 的 增加 而 收 进 。 当 向 量 长 度 为 31 时 ， 展 开 度 只 为 3 时 能 得 到 最 好 的 性 能 。 

循环 展开 的 第 二 个 缺点 是 它 增加 了 和 牛 成 的 革 标 代码 的 数量 。combine4 #7 HARG EA 63 TF T. 
IE XC US TERT HEUS 16 的 日 标 代码 需要 142 字 节 。 在 这 种 情况 中 ,代码 运行 得 几乎 快 了 一 倍 ， 似 乎 昌 
付出 小 小 的 代价 。 不 过 在 其 他 情况 中 ， 这 个 时 间 - 空 间 的 折衷 中 最 优 的 位 置 还 不 是 很 清楚 ， 

Xu. ҮЗЕ ДА 

编译 器 可 以 恨 容 易 地 执行 猪 环 刁 并 ， 只 要 优化 组 别 设 置 得 足 粘 高 【例如 ， 优 化 选项 为 “-D2” ), 
许多 编译 器 都 能 例行公事 地 做 到 这 一 点 在 命 作 行 上 以 “-fumroll-joops” 调 用 GCC, CARAI 
AR. | 


5.9 转换 到 指针 代码 


在 进行 下 一 步 之 月， 我 们 点 该 骨 尝 试 一 种 有 时 能 改进 程序 性 能 的 转换 ， 但 这 是 以 程序 的 可 读 性 
为 代价 的 。C 的 “个 独特 的 特性 是 能 够 对 任意 的 程序 对 象 创建 和 引用 指针 。 实 际 上 ， 指 针 运 算 与 数 
组 引用 有 很 紧密 的 联系 。 表达 式 *(ati) 给 出 的 指针 运算 和 引用 的 组 合 正 好 等 价 二 数组 引用 ali]. 有 时 ， 
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我 们 能 够 通过 使 用 指针 而 不 是 数组 改进 一 个 程 订 的 性 能 。 

图 5.22 给 出 了 个 将 过 程 combine4 和 combines 转换 成 指针 代码 的 示例 ， 分 别 得 到 过 程 
combine4p 和 combine5p。 与 保持 指针 data 固定 在 同 量 的 开始 处 相反 ， 我 们 每 次 夺 代 时 都 移动 它 。 
然后 ， 通 过 data HAERERE (0-2) 来 引用 向 量 元 类 。 最 重要 的 是 ， 我 们 能 从 过 程 中 消除 循环 变 
量 i。 为 了 确定 循环 该 在 什么 时 候 中 止 ， 我 们 计算 一 个 指针 dend 作为 指针 data 的 上 界 。 比 较 这 些 过 
程 和 它们 相应 数组 的 过 程 的 性 能 得 到 混合 的 结果 ， 


-= 2 — 


combined ЖЕҢГЕННЕН —— 
combine4p 指针 版 本 4.00 


combines ЖИЙ 3 1.33 
combine5x4 ЖА X4 1.50 5.00 
combine5px4 指针 版 本 1.25 400 | 300 5.00 


对 大 多 数 情况 来 说 ,数组 各 指针 版 本 的 性 能 完全 “Н.Н sok RU TREE RAR CPE 
实际 上 还 变 粮 了 一 个 周期 。 这 个 结果 有 点 奇怪 ， 因 为 指针 和 数组 版 本 中 的 狂 环 是 非常 芝 世 的 ， 如 名 
5.23 所 示 。 很 难 想 像 为 什么 指针 代码 每 次 迁 代 需要 多 一 个 时 钟 周期 。 同 样 不 可 思议 的 是 ， 过 程 四 次 
己 环 展开 的 版 本 使 用 指针 代码 能 产生 每 次 侈 代 一 个 周期 的 性 能 提高 ， 得 到 CPE 1.25 (ERER S 个 
周期 )， 而 不 是 1,5 (每 次 近代 6 个 周期 )。 





code/opticombine.c 
1 ЈР Accumulate in local variable, pointer version */ 
2 vold сошр1пе4р{уес_рїг v, data Б *dest) 
3 i 
4 int length = vec, length!v]; 
5 data t *da-a = get, vec startí(vl; 
2 data t *dend = data-«length; 
7 data t x = IDENT: 
8 
9 tor 4; data < dend; data++) 
19 х = X ОРЕН *data; 
11 *dest - x: 
12 ] 
cade/opt/combine.c 
(a) combines 的 指针 版 本 
code/opt/combine.c 
1 А Unroll loop by 3, pointer version */ 
2 void combine5pivec ptr v, data t *dest) 
3 1 
à data t %дага = get vec, starti(v!:; 


352 45% 


5 data t *dend = datasvec lengthív); 
5 data tL *dlimit = dend-2; 

7 data t x = IDENT; 

8 

9 Ж Combine 3 elements at a time %/ 

10 for t: data < dlimit; data += ài: 1 
11 x = x OPER data[90] OPER data[l1] OPER data[Z2]; 
12 } 

13 

14 /* Finish any remaining elements */ 

15 Гог [; data < dend; data++) 1 

16 x = x ОРЕН dataiÜl; 

17 } 

18 "dest = x; 

19 } 


code/apt/combine.c 


ib) combines 的 指针 版 本 


图 5.22 将 数组 代码 转换 成 指针 代码 
在 某 些 情况 中 ， 这 能 够 导致 性 能 的 改进 ， 


combine: type-INT, OPER = '+' 
data in %еах, x in %есх, i in %ейх, length in %ев! 


i .L24: loop: 
2 addl (Жеах,Фей4х,4),Фесх Add datali] to x 
3 incl %ейх i++ 
4 cmpl %ев1‚,%ейх Compare i;length 
2 11 .L24 H <, goto loop 
(a) Array code 
combinedp: typez INT, OPER = '+' 
data іп Deax, x in %ecx, dend in едх 
1 ‚130: loop: 
2 addl (%оах), Фесх Add datal] to x 
E addl 54, %еах data ++ 
4 cmpl Жейх,Феах Compare data:dend 
5 jb .L3C If <, goto loop 


(b) Pointer code 


图 5.23 指针 代码 性 能 异常 
TRAA ЕИ EF k НЩ, {НЕ АШ КЕЕ 2 个 周 期 ， 而 指针 代码 需 昌 3 个 。 


根据 我 们 的 经 验 ， 指 针 和 数组 代 坦 的 相对 性 能 依赖 于 机 器 、 编 详 器， 甚至 于 某 个 特殊 的 过 程 。 
我 们 已 经 看 过 编 详 器 , 它们 对 数组 代 坦 应 用 上 东 常 高 级 的 优化 ,而 对 指针 代码 只 应 用 最 小 限度 的 优化 ， 
为 了 吕 访 性 的 缘 卜 ， 通 常数 组 代码 更 可 了 到- 些 ， 
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Ф518 54 
А, ОСС B CK umi ARD. зо, 1 R KB PLE Ле y) ДЕ ЭН 
BF, GCC 为 combines 6 — A X: $645 N JA S Л ЖО PAARE, а ЛАА. 


„LE: 

addl {%еах),%едйх 
addl 4(%еах),%#едх 
addl 8 (%еах), %едх 
addl 12 (%еах), Фейх 
addl 16(%еах),%ейх 
addl 20(%еах), %едх 
addl 24 (%еах), едх 
add. 28 (%еах) ,Sedx 

0 addl 522, %еах 

11 addl 58, жесх 

cmpl %ев1,%есх 

13 ji .16 


m C 3j 4-28 сах 是 如 何 每 次 选 代 增 加 32 的 ， 

H mit combineSpx8 t C 代码 ， 展 示 这 段 代 码 是 如 何 计算 指针 、 狂 环 变量 和 中 止 条 件 的 Ж 
КЕ 5.19 的 风格 ， 给 出 使 用 任意 数据 和 合并 操作 的 通用 格式 。 描 述 它 与 我 们 手写 的 指针 代码 【图 
522) 有 何 区 别 ， 


I- аз са -1 vcn un H= 0 го ҥе 


mb 
ыз 


5.10 ”提高 并 行 性 

在 此 ， 我 们 的 程序 是 受 功能 单元 的 执行 时 间 限制 的 。 不过， 好 图 5.12 中 第 三 栏 所 示 ， 处 理 器 的 
几 个 功能 单元 是 流水 线 化 的 ， 这 意味 着 它们 可 以 在 前 一 个 操作 完成 之 前 开始 “个 新 的 操作 。 我 们 的 
代码 不 能 利用 这 种 能 力 ， 即 使 是 使 用 循环 展开 也 不 能 ， 这 基因 为 我 们 将 累积 值 放 在 … 个 单独 的 变 基 
х 中 。 直 到 前 面 的 计算 完成 之 前 ， 我 们 都 不 能 计算 x КЕ. АҢ, ЖЕН (маш), ФЕ 
始 新 的 操作 ， 直 到 当前 操作 完成 。 图 5.15 和 图 5.17 中 很 清末 地 展示 了 这 个 限制 。 即 司 有 下限 的 椒 


理 器 资源 ,乘法 器 也 只 能 每 四 个 时 钟 周 期 产生 一 个 新 的 结果 。 对 于 浮 点 加 法 《三 个 周期 TUE (五 
个 周期 ) 也 会 有 类 似 的 限制 。 


5.10.1 循环 分 割 (loop splitting) 
对 于 一 个 9 结合 和 可 交换 的 合并 操作 来 说 ， 比 如 说 整数 加 法 或 乘法 ， 我 们 可 以 通过 将 一 组 合并 操 
作 分 割 成 两 个 或 更 多 的 部 分 ， 并 在 最 后 合并 结果 来 提高 性 能 。 例如，P, 表示 元 素 ay ао, ЗЕ: 


假设 为 偶数 ， 我 们 还 可 以 把 它 写 成 P. = PE, xPO,， 这 里 PE, 是 索引 值 为 偶数 的 元 素 的 乘积 ， 而 
PO- 是 索引 值 为 育 数 的 元 素 的 乘积 ， 
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n!2-2 
PE, = dj 
і- 
ni 2-2 
PO, = П... 
i=D 


图 524 屠 泵 的 基 使 用 这 种 方 法 的 代码 。 它 既 使 用 了 两 次 循 二 展开， 以 使 每 次 选 代 合并 更 多 的 元 
X. BEH TART 2938518018 38) ZUR RR EE RE хі, ТЕЗИ АА ИО ЖАТ 
& хіт, ЕНЕ =- 样 , 我 们 还 包括 了 第 一 个 箱 环 ,对 于 向 量 长 度 椒 为 2 HER, RAA E RIA 
FAE) МЕЈН лж. R RIR x0 和 x] 应 用 人 台 并 操作 ， 计 算 最 终 的 结果 。 


一 一 -一 一 --------- ————  codeopticombine.c 
1 /* Unroll loop by 2, 2-way parallelism */ 

2 void combinebivec ptr v, data t *dest) 
3 1 

4 int length = vec_lengcehivi; 

5 int limit = length-1; 

5 daLa t *data = get vec startivi: 
7 Gata t хб = IDENT; 

B Чаба t xl = IDENT: 

3 int 1; 

10 

11 Ж Combine 2 elements at a time */ 

17 for (i = б; à < limit; i«-2) f 
13 x] = хо OPER data[il; 

14 x] = хі OPER data[i«1ll; 

15 ) 

16 

17 % Finish any remaining elements */ 

18 тәр {; 1 < length; i«4] 1 

18 х0 = х) OPER даға(11; 

AQ | 

21 “дені = xÜ GPER xl; 

22 | 


code/opt/combine.c 
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„1151: 


imu,l iteax,*edx,4],€ecx load (%ғах, *edx.0, 4) 


imull t.la, %ecx.D 
imu.l 4di&eax,t*edx,4), жерх load 4'%еах, %ейх.й, 4] 
imull t.lb, &ebx.ü 
addl 52,&edx addl 52, &edx.( 
Сірі *esi, €*edx cmpl &esi, Жейк.1 
il ,Lihl jl-taken cc.1 


图 5.25 给 出 了 第 一 次 选 代 《i=0) 的 操作 的 图 形 化 表示 。 正 如 这 张 表 说 明 的 那样 ， 循 环 中 的 两 
个 如 法 是 相互 独立 的 。 ' 个 以 寄存 器 和 ecx 作为 它 的 源 和 下 的 (对 应 于 程序 变量 x0)， 而 为 -个 以 宕 
存 器 %ebx 作为 它 的 源 和 日 的 《对 应 于 程序 变量 х1). 第 二 个 乘法 在 第 - -个 的 后 一 个 的 后 一 个 周期 就 
可 以 开始 了 。 这 利用 了 加 载 单 元 和 整数 乘法 器 的 流水 线 化 的 能 力 。 


едх 0 





执行 单元 操作 

load (%gax, 3eđdx.0, 4) 
imull t.la, %есх.0 
load 4(&eax, *edx.0, 4) 


imull t.1b, ерх, о 
addl $2, %е4х.0 
cmpl sesi, *edx.1 
jl-taken ес, 1 





图 525 二 次 展开 、 二 路 并 行 的 整数 乘法 内 循环 的 第 一 次 迭代 操作 
ЖӘ-НЕ РН IO. 


图 5.26 ЕТ E EBORE EE ИОАН (i=0, 2814). КЕЛМЕ. HATERA, PS 38 
法 都 必须 等 待 ， 直 到 前 一 次 选 代 的 结果 计算 出 来 。 这 个 机 器 还 是 能 每 下 个 时 钟 周 期 产生 两 个 结果 ， 
ТЕН 理论 上 的 CPE 2.0. 在 这 幅 图 中 ， 我 们 不 考虑 整数 功能 单元 的 有 限 集合 ， 但 是 也 没有 证 明 它 
是 这 个 特殊 过 程 的 限制 。 

比较 只 进行 循环 展开 和 使 用 循环 展开 以 及 两 路 并 行 ， 我 们 得 到 以 下 的 性 能 ; 


方 法 
EF x2 1.50 4.00 3.00 5.00 
сопізілеб 354 展开 X2, т X2 1.50 2.00 2.00 2.50 


对 于 整数 永和 ， 并 行 化 并 没有 帮助 ， 因 为 整数 加 法 的 热 行 时 间 只 是 一 个 时 钟 周 期 。 不 过 对 于 整数 和 
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Лан, RUD СРЕ ЖИТ 1 倍 。 从 本 质 上 看 ， 我 们 加 售 地 使 用 了 功能 单元 。 对 于 浮 点 加 法 ， 某 
НЫНЕ НЕГО CPE 限制 在 了 20. ЛЕНІ 15. 

我 们 早 就 知道 ， 二 进 制 补 码 运 焉 是 可 变换 和 可 由 全 的 甚至 于 洲 出 时 也 是 如 此 。 因 此 ， 对 于 莫 
获 数 据 类 型 ， 在 所 有 可 能 的 情况 下 ，combine6 计算 出 的 结果 都 和 combines 计算 出 的 相同 。 因 此 ， 
优化 编译 器 六 在 地 大 够 将 combined 让 所 示 的 代码 首先 特 换 成 combines 的 一 个 二 路 狂 环 展开 变种 ， 
然后 再 通过 引入 并 行 性 ， 和 将 之 转换 成 sombine6 的 一 个 变种 ， 在 优化 编 详 器 的 语言 中 , ШЕЕ К 
3| Citeration spliuing)。 许 地 编 译 器 自动 进行 展 环 属 开 ， 但 是 进行 造 促 分 割 的 编译 器 相对 比较 几 了 ， 


ЕС; Ай: —— MÀ —  —á— —— г 2% 


КЫ a Bo #50 
"әже palus d а: = -—— 
е i 





Ета 
8526 (&*SEHMRT, DARA. ИЕШЕ ЕНЕНЕ 
ЕНЕС a РАНЕ IN T. 

MN Nil RAAH А НТО А нр ri), ШЕ. ЕЦ h АШ. combines 和 
combine 可 能 产生 不同 的 结 时 Pm, HELEH BUH RS IN И О NEUES HE 
常 大 的 数 ,而 索引 人 为 奇数 的 元 过 者 非 常 接近 于 00. ЖА. НЕЕ НЕ Р, TARH, ЖЫ РЕ, 
也 可 稻 溢 出 ,或 者 PO, 也 可 能 下 溢 。 不 过 在 大 名 数 现 实 的 程序 中 ， 不 太 可 能 出 现 这 样 的 情况 。 因 为 
大 字数 物理 现象 是 连续 的 ， 所 以 数字 鉴 据 也 趋向 于 相当 的 平 请 ， 不 会 出 什么 问题 。 即 使 是 有 不 连 彝 
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HER CERETTA АТО E AI TERIERE REL FREE RR EC ERRER Л Ж ЖАТА I T 
能 会 有 比 “ 分 成 两 组 独立 求 和 ， 然 后 再 将 这 两 个 和 相 加 ”根本 上 更 好 的 准确 性 。 w А ЖУН ТЕРЕ 
Жай, РЕВЕ ЗЕ ЕН НА АЕ Е и, НЕ, EER RA nWZ 
地 淤 在 的 用 户 协 商 ， 看 看 是 否 有 特殊 的 条 件 ， 可 能 会 导致 娃 忆 后 的 算 靶 不 能 接受 。 

就 像 我 们 能 以 任意 次 数 天 展开 循环 ， 我 们 也 可 以 增加 并 行 度 为 任意 因子 p. (816 k TED p € 
除 。 下 而 是 对 于 不 同 展开 次 数 和 并 行 度 的 一 些 结果 : 


‚О HRX? 


‚ ЖЕН? 


‚ НТ х2 
, PIEKA 
, НІН ХЕ 
， 并 行 度 X3 


正如 这 张 表 说 明 的 那样 ， 增 加 循环 的 展开 度 和 并 行 度 能 帮助 程 译 性 能 达到 某 个 点 ， 也 是 当 取 到 
极限 的 时 候 ， 性 能 的 增长 融 减 缓 了 。 在 下 一 蔬 中 ， 我 们 将 会 描述 出 现 这 种 现象 的 两 个 原因 。 


5.10.2 寄存 器 溢出 〈register spilling) 

簿 环 并 行 性 的 好 处 是 受 描 述 计 算 的 汇编 伐 码 的 能 力 跟 制 的 。 特 别 才 ,Ia32 指令 集 只 有 很 少量 的 
寄存 器 来 仔 放 黑 积 的 值 。 如 于 我 们 有 并 行 度 p 超过 了 可 用 的 寄存 器 数量 ， 编 详 器 会 拆 诸 于 洪 出 
(spiling)， 将 某 些 临时 值 存放 到 栈 中 。… 旦 出 现 这 种 情况 ,性 能 会 急剧 下 降 。 当 我 们 试图 使 p=8 时 ， 
对 我 们 的 基准 程序 就 发 生 了 这 种 情 说 。 我 们 的 测量 值 显示 此 种 情况 下 的 性 能 比 р=4 时 的 性 能 更 差 ， 

对 于 整数 数据 类 型 的 情况 ， 总 共 只 有 八 个 整数 寄存 器 可 用 。 其 中 有 两 个 5%ehp 和 %esp) {БШ 
栈 中 汐 区 域 。 在 这 段 代 码 的 指针 版 本 中 ， 剩 下 的 六 个 寄存 器 中 有 一 个 要 存放 指针 data， 还 有 一 个 要 
FRENE dend。 这 就 只 剩 下 四 个 整数 寄存器 可 以 用 来 存放 累积 的 售 了 。 在 这 段 代 公 的 数组 版 本 
中 ， 我 们 需要 三 个 寄存 器 来 保存 循环 索引 值 i, PERSH limit, UAHA даа. ARARA F 
三 个 整数 寄存 器 可以 用 来 存放 标 积 的 值 。 对 于 浮 点 数据 类 型 ， 我 们 需要 八 个 寄存 器 中 的 遇 个 来 保存 
中 则 秆 ， 剩 下 六 个 用 于 累积 值 。 因 此 ， 我 们 能 得 到 在 发 生 寡 存 器 溢出 之 前 ， 报 大 并 行 麻 为 5。 

ҚЗ ATHE а ЖШ ИЛЛЕ 1A32 指令 集 的 不 幸 产 物 。 前 面 讲 到 过 的 重 命名 机 制 消除 
了 寄存 器 名 宇和 寄存 器 数据 实际 位 置 之 间 的 联系 。 在 现代 处 理 器 中 ， 寄 存 器 名 字 只 简单 地 用 来 标识 
在 功能 单元 之 问心 递 的 程序 值 ,。 ТАЗ2 只 提供 了 很 少量 的 这 样 的 标识 符 , 限制 了 在 程序 中 能 表达 的 并 
ТЕКЕ. 

ЖЮ ЖҮ АЧ ВЕ LIAE. ЖИ. ТЕЛЕУТ НО S … 个 循环 中 ， 我 们 看 到 
下面 的 指令 序列 ， 


Туре=1ЇМТ, ОРЕК = '*' 
x6 in -12(9oebp), data+i in Феах 
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1 movl -12(%вБр),%ейі 

2 imull 24[*eax),€edi 

3 movl %edi,-1l121%ebp) 
БЕКЕН, ТКЕН ЖЕН xo, ЛАТ PE P B hH [К —1-ЖН ЖАН. ЖА /ЧН 
ПЕН, Ел, Жл gU —EERUDERCB. TEA — 3 HR 
Wu, ДАЧ 24 ARET Е nop Hi fE t S E THEA A SEES КОЕН. СЕ 
ФРА, Z ЕЛАНА. BIA NAE RIPE RE НЕШ РП a 


355% 


Get хб from stack 
Multiply by datafi46] 
Put x6 back 


下 面 给 出 的 是 报 据 comhbine6 ñ — A ЖАЯ ААА, Ede] T CR IB HUK T doo 3. 


5 B 5.5 

1 ‚157: 

2 addl { гах), *есх 

3 addl 4(€&eax!,&esi 
à addl Я [%eax), edi 
5 addl 12{%еах),%еһх 
5 addl 16{%еах},%есх 
7 addl 20{%еах},%ев1 
B addl 24 (еах), Sed 
9 addi 281%eax) ,$ebx 
10 addl $32,*eax 

11 addl &8, едх 

12 cmpl -ё (еро), %ейх 
13 jl .L152 


A. FZ 388 E $R hka] ДР? 


B. 3k 8] T ЖНА W? 
С. ЭЖ АЖ Л ЛЖ h ABD R Ar k HET 


使 用 浮 点 数据 时 ， 我 们 希望 将 所 有 的 局 部 变量 都 放 在 浮 点 寄存 器 栈 中 。 我 们 还 需要 保持 栈 项 可 
用 于 从 存储 器 加 载 数 据 ， 这 限制 了 并 行 度 小 二 或 等 于 7。 


510.3 ”对 并 行 的 限制 

对 于 我 们 的 基准 程序 ， 主 要 的 性 能 限制 是 由 于 功能 单元 的 能 力 。 如 司 5.12 Bios, WARES 
浮 点 加 法 器 内 能 每 个 时 钟 周期 发 起 一 条 新 操作 。 K, 加 上 对 加 载 单元 的 类 似 限 制 , 将 这 些 情况 的 CPE 
限制 在 了 1.0。 浮 点 乘法 器 只 能 每 商 个 时 钟 周期 发 起 一 条 新 操作 。 这 就 将 这 种 情况 的 CPE 限制 在 了 
2.0。 由 于 加 载 单 元 的 限制 ， 整 数 求 和 被 限制 在 了 CPE 1.0， 这 就 导致 了 下 面 对 达 到 的 性 能 与 理论 极 


BLA а] RS ERE: 


理论 限制 


1.00 


1.00 
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在 这 张 表 中 ， 为 每 种 情况 ， 我 们 都 选择 能 达到 最 佳 性 能 的 展开 和 并 行 的 组 合 。 对 于 整数 求 和 和 
乘积 以 及 浮 点 乘积 ， 我 们 能 够 接近 理论 极限 值 。 某 个 〈 或 某 些 ) 与 机 器 相关 的 因素 将 浮 点 葬 法 能 达 
到 的 СРЕ 限制 天 了 LS0， 而 不 是 理论 极限 值 1.0。 


练习 题 5.8 
考虑 下 面 的 计 普 亚信 整数 的 数组 末 积 的 函数 。 我 们 三 次 展开 这 个 循环 


int aprodíint a[], int п) 
l 
int 1, X, V, Z; 
int r = 1; 
for {i = Ü; i < m-2; is- 3) Í 
х= ali]: v = а[і+1]; z = а[1+2]; 
r = r * x * ү * z; /% Product computation */ 
} 
for i; i < ni X++) 
r *- ali]; 
rerurn r; 


) 


Яр 475 7) Product computation € fr, ЖАТИ 4&5 €] s dp Xs КЛЕЮ. RF 
BF: 
(ir * x) * y) * 2; /% Al */ 
{с * ix * yl] * z; /* А2 */ 
Y * (Ix * y) * z); /* АЗ Ж 
г * (x * (y * zj); /* h£ +; 
(r* x) * [у * zi; /* A5 */ 

我 们 在 Pentium Ш Е 测试 了 洱 孝 的 这 五 个 版 本 。 回 想 一 下 图 5,2. АЯЛЫ РА 
作 的 执行 时 间 为 4 个 周期 ， 发射 时 间 为 1 个 周期 。 

下 面 的 表 绘 出 了 一 些 CPE VE, misit T. 测量 出 的 CPE 值 是 实际 观测 到 的 “理论 CPE” 
的 意思 是 当 限 制 四 素 只 为 执行 时 间 和 整数 乘法 器 时 能 够 达到 的 性 能 ， 


а e | — _ 
„ү 
„Гәү j 
= ү 
dE dA AS. xD BS CPE 的 度量 值 ， 你 可 以 使 用 杂 自 其 他 有 相同 计算 行为 的 版 本 的 


值 . 对 于 CPE 的 理论 值 , 你 可 以 只 考 虚 来 法 器 的 执行 时 间 和 发 射 时 间 , 确定 一 次 选 代 所 需 的 周期 数 ， 
然后 再 除 以 3, 


ч мны H 


Г 
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5.11 综合 ; 优化 合并 《Combing〉 代码 的 效果 小 结 


В, 我们 已 经 考虑 了 合并 《Combing) 代码 的 六 个 版 本 ， 其 中 有 的 还 有 多 个 变种 。 让 我 们 暂 
b -下 ， 玉 看 看 这 栅 努力 的 牙 伍 效果 ， 以 及 我 们 的 懂 码 是 如 何在 一 台 不 同 的 机 器 上 执行 的 。 图 5.27 
给 出 欧 是 对 我 们 所 有 函数 以 及 几 个 其 他 变种 的 度量 性 能 。 正 如 看 到 的 那 福 ， 我 们 只 要 简 伴 地 展开 答 
环 多 次 ， 雹 能 达到 整数 求 和 的 最 大 性 能 ， 但 是 对 于 其 他 操作 ， 我 们 引入 一 蔡 ( 但 不 是 很 多 ) HTE, 
整体 性 能 达到 了 276 倍 ， 比 我 们 原始 的 代码 好 了 很 多 。 


combinel : UU RSS ES 

combinel К Н 3 l -o2 - 2 3125 
combine2 ЖАЛ vec length 21.15 
combined : 直接 数据 访问 | . 8.00 


comb пел қ RP AER rH 
comb:ne5 BETTE X 4 
EFIS 
combinéeb B H x2, HH х2 
R3T X4, }{тх2 
ERAR, HITA 





图 5.27 паж 
圳 能 好 好 的 版 本 州 厄 体 表示 。 


5.11.1 FAEERE 

图 5.27 ВАЖНЕЕ — Ж. 当 我 们 从 将 combine3 的 乘积 累积 在 存储 占 中 , Ж combined 
的 乘积 累积 在 一 个 浮 点 寄存 器 中 ， 浮 点 科 法 的 周期 数 急剧 下 降 。 通 过 这 么 一 点 小 小 的 改动 ， 代 和 码 到 
TCR T 23.4 倍 。 当 出 现 这 样 一 种 出 平 意料 的 结 烛 时 ,猜测 是 什么 可 能 引起 这 样 的 行为 ， 然 后 设计 
一 系列 试验 来 评估 这 个 假设 ， 这 是 很 重 杯 的 。 

当 我 们 音 看 这 张 表 时 ， 对 浮 点 乘法 的 情况 来 说 ， 如 果 将 结果 累积 在 存 储 器 中 ， 好 像 有 点 奇怪 的 
事情 会 发 生 。 即使 功能 牛 元 的 周期 数 是 相当 的 , 它 的 性 能 比 浮 点 如 法 或 整数 飞 法 的 性 能 都 要 荆 很 多 。， 
在 个 1IA32 处 理 器 芋 ， 所 有 的 泽 点 操作 都 是 以 扩展 的 ВО 位 精度 执行 的 ， 而 浮 点 寄存 器 也 是 接 照 这 
个 格式 存储 但 的 。 只 有 当 寄 存 器 中 的 值 写 入 存储器 中 时 ,， 才 把 它 转 换 成 32 位 〈 浮 点 数 ) n 64 (ë O08 
RB. 

Hr r P Ит Н] BIA ИРКЕН T АЕ ТЕ 一 个 长 度 为 1024 的 向 量 上 执行 的 ， 
X^" |n] йй лж i 的 怕 等 于 i+1。 因 此 ， 我 们 是 在 试图 计算 1024!， 它 太 约 是 54x10. А 
太 的 一 个 数 可 以 用 扩展 精度 的 浮 点 格式 ( 它 可 以 表示 到 大 约 10 7^ 的 数 } 表示 ， 但 是 它 大 大 超出 了 
单 精度 (大约 10°) 或 双 精 度 (大 约 1095) 能 表示 的 范围 。 当 我 们 到 达 =34 时 ， 单 精度 的 情况 就 会 
次 出 了 ,而 当 我 们 达到 ji=171 时 , 双 精 度 的 情况 就 会 溢出 了 .一旦 我 们 达到 这 一 点 ,每 次 执行 combine3 
的 内 部 循环 中 的 语 名 
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*dest = *dest OPER val; 


都 要 从 dest (оо, WERA va, Ao, HERETER dest， 很 明显 ， 这 个 计算 的 基 个 部 
分 需要 出 泽 点 乘法 所 要 的 正常 的 五 个 时 钟 周期 长 得 多 的 时 间 。 实际 上 ， 对 这 个 操作 进行 测试 ， 我 们 
发 现 用 一 个 数 乘 以 无 穷 大 会 花费 110 一 120 个 周期 。 很 可 能 ， 硬 件 察 觉 了 这 个 特殊 和 情况， 发 出 一 个 陷 
阱 【trap)， 它 会 使 一 个 软件 函数 执行 实际 的 计算 。CPU 设计 者 觉得 这 样 的 情况 会 非常 军 移 ， 以 全 于 
他 们 不 需要 用 硬件 设计 的 一 部 分 来 处 理 它 。 对 于 下 湛 也 会 发 生 类 羽 的 行为 ， 

当 我 们 在 每 个 向 量 元 素 等 于 L0 的 数据 上 运行 基准 程序 时 , 对 双 精 度 和 单 精度 ,combine3 的 CPE 
都 达到 了 10.00 周期 这 与 对 其 他 数据 类 型 和 操作 进行 度量 到 的 时 间 更 加 一 致 ， 而 内 与 gombine4 的 
时 间 也 是 相当 的 。 

这 个 示例 说 明了 评估 程序 性 能 的 -- 个 挑战 ， 蛛 本 看 上 去 无 中 轻重 的 数据 和 操作 条 件 能 严重 地 影 
响 测 量 结 果 ， 
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虽然 我 们 是 在 一 个 特殊 的 机 器 和 编译 器 环境 中 讲述 我 们 的 优化 策略 的 ， 伍 是 通用 的 原则 也 适用 
于 其 他 机 器 和 编 兰 器， 当然， 最 优 的 策略 可 能 是 与 机 器 相关 的 。 作 为 一 个 示例 ， 图 5.28 给 出 的 是 
Compaq Alpha 21164 处 理 器 在 与 狗 5.27 中 所 示 的 Pentium HI 相当 的 条 件 下 的 性 能 结果 ,这些 测试 及 
用 的 是 Compaq C 编译 器 生成 的 代码 ， 它 使 用 了 比 GCC 更 多 的 高 级 优化 。 我 们 观察 到 ， 随 着 我 们 沿 
着 表 往 下 走 ， 周 期 时 间 通 常会 降低 ， 就 像 对 其 他 机 器 一 样 。 我 们 看 到 ， 我 们 能 有 效 地 运用 更 站 程度 
CARD 的 并 行 ， 这 是 因为 Alpha 有 32 个 整数 和 32 个 浮 点 寄存 器 。 正 如 这 个 例子 说 明 的 那样 ， 程 
序 优化 的 通用 原则 对 各 种 不 同 的 机 器 都 适用 ， 即 使 某 种 特殊 的 特性 组 合 会 导致 最 优 性 能 依赖 于 特殊 
的 机 器 。 


combinel XU ritis ds 
combinel 3299 |4##Ёй-О2 
combine2 330 ЖЫ) уес length 
cembine3 334 直接 数据 访问 


ccmbine4 315 E Bt SEM 
cembine5 347 RJ XA 
, ЕН 16 

combines | 354 | 展开 X4， 并 行 X2 

展开 XX8， 并 行 X4 

WOT X8, Ж1ТХВ 





图 528 所 有 合并 函数 运行 在 Compoa Alpha 21164 处 理 器 上 的 结果 比较 
同样 的 通用 优化 技术 在 这 种 机 器 上 也 有 用 。 
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5.12 分 文 预测 和 预测 错误 处 罚 


正如 我 们 表面 提 到 过 的 ， 现 代 处 理 器 在 执行 当前 指令 之 表 能 工作 得 很 好 ， 从 存储 器 读 新 指令 ， 
并 解码 指令 ， 以 确定 在 什么 把 作 数 上 执行 什么 拘 作 。 只 要 指令 遵 箱 的 是 -- 种 简单 的 顺序 ， 那 么 这 种 
指 信 流水线 化 〈instruction pipeline) 就 能 很 好 地 工作 。 不 过 ， 当 遇 到 分 支 的 时 候 ， 处 理 器 必 有 织 猜 测 
ЖЕН 7 Н Ж. ЯТ R PF26456 ТИЕ, ха ЕПА ж. РАННЕЕ C 
像 我 们 在 代码 中 看 到 的 ， 跳 转 到 由 -个 跳 转 表 条 日 指定 的 地 址 ) 或 过 程 返回 这 样 的 指令 ， 这 意味 着 
巴 测 日 宗 地 址 。 在 这 里 ， 我 们 虞 中 讨论 条 忻 分 六。 

在 个 使 用 投机 执行 Gpeculative execution》 的 处 理 器 中 ， 处 理 器 会 开始 执行 预测 的 分 交 日 标 
处 的 指令 。 它 这 样 做 的 方式 是 ,避免 黎 改 任何 实 了 的 寄存 器 或 存 种 嚣 位置， 直到 靖 定 了 实际 的 结果 。 
如 果 孔 测 是 正确 的 ， 处 班 器 就 简单 地 “提交 ”投机 执行 的 指令 的 结 六 ， 把 它们 存储 到 寄存 器 或 存储 
老 中 。 如 果 预 独 是 错误 的 ， 处 理 器 必须 斑 弃 掉 所 有 投机 执行 的 结 尝 ， 在 正确 的 售 置 ， 重 新 开始 取 指 
令 的 过 程 。 这 样 做 会 引起 很 大 的 分 支 处 罚 (branch penalty)， 因 为 在 产生 有 用 的 结果 之 前 ， 必 须 重 新 
填充 指令 流水 线 ， 

直到 最 近 ， 莹 竺 投机 执行 所 需 的 技术 都 被 认为 是 开销 太 上 大 ， 对 除了 最 高 级 的 超级 计算 机 以 外 的 
ЖЕЛЕ ЕН ДЕІН. 不 过 大 约 从 1998 年 开始 , 集成 电路 技术 使 得 叮 以 在 一 块 芯 片上 放置 
如 此 之 多 的 电路 ， 以 侍 于 有 些 电路 可 以 专门 用 来 友 持 分 支 预 测 和 投机 执行 。 到 日 前 ， 台 式 机 或 服务 
«Bp SML EB BAHIDUT. 

ТАЛАР ПЕ ЕР, DIS 8 АУ TERES IE R|. «E. E EXUTERE 
惟一 的 限制 因素 是 由 于 蕊 能 单元 。 对 于 这 个 过 程 处 理 ， 处 理 器 通常 能 够 预测 循环 结尾 处 的 分 支 的 方 
同 。 实 际 上 ， 如 果 处 理 器 总 是 预测 会 选择 分 支 ， 那 么 除了 对 最 后 一 次 选 代 以 外 ， 它 者 是 对 的 。 

入 们 已 经 提出 了 诈 多 方法 来 预测 分 支 ， 和 而 且 对 这 些 方法 的 性 能 也 进行 了 很 多 研究 。 一 种 常见 欧 
月 发 式 方法 是 预测 任意 到 较 低 地 址 的 分 支 都 会 被 选择 ， 而 任何 到 较 高 地 址 的 分 支 则 不 会 。 到 较 低 地 
址 的 分 支 是 用 来 关闭 循环 的 ， 因 为 循环 通常 会 执行 多 次 ， 预 测 这 些 分 支 会 被 选择 是 个 好 主意 。 另 一 
方 血 ， 前 同 分 交 是 用 于 条 忻 计 算 的 。 实 验 表 明 后 向 选择 、 前 向 不 选择 的 启发 式 方法 在 大 约 的 多 的 时 
间 里 巧 正确 的 。 向 预测 所 有 的 分 支 都 会 被 选择 的 成 功率 只 为 大 约 60%. cb EE USERS. НЕ 
eR. PIA. Intel Pentium H 和 III 处 理 器 使 用 的 分 支 预测 策略 声称 在 90% — 9590 ЕГІН 
ДЕТЕЙ] a 

我 们 可 以 进行 实验 来 浏 试 处 理 器 的 分 支 预 测 的 能 力 ， 以 及 预测 错误 的 代价 。 我 们 用 图 5.2911} 
示 的 绝对 值 图 数 作 为 我 们 的 测试 示例 。 这 幅 图 还 给 出 了 编译 后 的 形式 。 对 于 非 负 的 参数 ， 分 支 会 被 
选择 ， 以 覆 过 为 负 对 的 指令 。 我 们 允 这 个 计算 个 数组 中 每 个 元 素 绝对 值 的 冰 数 计时 ， 这 个 数组 是 
由 +] 入-1 的 各 种 模式 组 成 的 。 对 于 规则 的 模式 例如， 全 +1、 全 -1 或 交替 的 +1 和 -1)， 我 们 发 现 
ВА 995 32 13.01-13.41 个 周期 我们 以 此 作为 我 们 完美 分 支 条 件 EREA. ЖТ 个 设置 为 
+1 和 -1 的 随机 模式 的 数组 , ТАНА ЕЕ 20.32 个 周期 。 随 机 处 理 的 一 个 原则 是 克 论 用 什么 策 
瞳 来 狐 测 值 的 序列 , 如 果 底 层 的 处 理 是 真正 随 树 的 , 那么 我 们 具 可 能 有 50 够 的 时 间 是 正确 的 。 例 如 ， 
无 论 一 个 人 用 什么 策略 来 猜 扔 硬币 的 结果 ， 只 筑 扔 而 币 是 公平 的 ， 成 功 的 椭 率 就 只 能 是 人 .5。 因 市 ， 
我 们 可 以 看 到 ， 这 个 处 理 器 预测 错误 的 分 支 会 引起 大 约 14 个 时 钟 周 期 物 处 罚 ， 因 为 50 名 的 其 测 错 
误 率 会 导致 函数 运行 平均 慢 7 个 周期 。 意 思 就 是 说 ， 对 absval 的 调用 依据 分 支 预测 的 成 功率 ， 需 要 
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13—27 个 周期 。 
codefopt/absval.c 
1 ілі absvalí(int val) 
2 { 
3 return (val«0) ? -val : val; 
4 ) 
codelopt/absval.c 
(a) C 代码 
l absval: 
2 pushl *ebp 
3 movl €esp,$ebp 
4 movl 8 (жерр),%еах Get val 
5 testi %eax,%eax Test it 
6 jge .L3 If >Ü, goto end 
7 negl $eax Else, negate it 
В „1,3: ела: 
9 movl %ерр, евр 
10 рорі $ebp 
11 ret 
(b) TUI 
图 5.29 ”绝对 值 代码 


我 们 用 这 段 代 码 来 测量 分 支 预 测 错 误 的 代价 ， 


14 个 周期 的 处 州 是 相当 六 的 。 例 如， 如 果 我 们 的 预测 准确 率 只 有 6595, НАЗЕ, 
处 理 器 平均 会 浪费 14X0.35=4.9 周期 。 即 使 是 Pentium II 和 ШЕМ КЕЙ Ж. 90%--05%, ІҢ 
于 预测 错误 , 每 个 分 支部 会 浪费 大 约 1 个 周期 。 对 实际 程序 的 研究 表明 , 在 典型 的 “整数 ”程序 (也 
Ж, EREE ЕНЕР) 中 ， 分 支 太 约 占 到 了 所 有 执行 指令 的 15 免 ,而 在 典型 的 小 数 程 
序 中 ， 分 支 大 约 占 3 名 一 12 免 [33j， 因 此 ， 由 于 低 效率 的 分 支 处 理 造成 的 任何 时 间 浪 费 都 能 对 处 理 
器 性 能 产生 很 大 的 影 啊 ， 

许多 与 产 据 相关 的 分 支 是 根本 不 能 预测 的 。 例 如 ， 没 有 任何 依据 猜测 我 们 络 对 值 明 数 的 一 个 参 
数 是 正 效 还 是 负数 。 为 了 提高 包括 条 件 求 值 代码 的 性 能 ， 许 多 处 理 器 设计 被 扩展 来 包括 条 件 传送 
(conditional move) 指令 。 这些 指令 多 许 某 些 形式 的 条 件 句 不 需要 任何 分 支 语 句 就 能 实现 。 

(Е 1A32 指令 集中 ,从 PentiumPro 开始 描 加 了 许多 不 同 的 emov 指令 。 最 近 所 有 的 Intel 和 与 Intel 
兼容 的 处 理 器 都 支持 这 些 指 令 ， 它 们 执行 的 操作 类 似 于 C ЖШ: 

if (COND) 

Хх = Y; 

这 里 y 是 源 操作 数 ， 而 x 是 目 欧 操作 数 。 条 件 COND 确定 是 否 要 执行 拷贝 操作 ， 它 是 基于 条 件 
码 值 的 某 种 组 合 的 ， 荣 似 于 测试 和 条 件 转移 指令 。 作 为 一 个 示例 ， 当 条 和 件 码 表明 一 个 值 小 于 0 8, 
cmovll 指令 执行 一 个 拷贝 。 注 意 ， 这 条 指令 的 第 一 个 “1” 表 示 “1ess《 小 于 )”， 而 第 二 个 “1” 是 
GAS 表示 长 字 的 后 缘 ， 
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P 面 的 汇编 代 翅 展示 了 了 允 何 用 条 件 传 过 来 搓 现 绝对 值 ; 


1 movl 8 (жеро}, %еах Get val as result 

2 movl €eax,tedx Copy to %ейх 

3 negl Фейх Negate Фейх 

4 testl %еах,%едх Test val 

5 Conditionally move Фейх to Феах 

б cmovll Sedx, Seax If < 0, сору %edx to result 


ЕПВ {ЫШ ИҢ ВУ AE. ЖД val ЛЕНИЙ, dE -val #5 val 为 负 时 ， 丰 条件 地 
将 它 传 送 到 寄存 器 和 eax 以 改变 返回 值 。 我 们 半 这 段 伐 码 的 测试 表明 无 论 数 据 懂 式 怎样 ， 它 部 运行 
13.7 个 周期 。 该 不 体 性 能 明显 地 好 于 需要 1327 个 周期 的 过 程 。 


$3 5.7 

BiA TARA ММЕН НЕЕ. VoU RET EYE C Қа; 
1 /* Dereference pointer or return 0 if null */ 
2 int deref(int *хү) 

3 i 

4 return xp ? *xp : 0; 

5 


| 
编译 器 为 过 程 体 产生 下 面 的 代码 ， 


| movi Бізерр),%ейх Get xp 

2 movi (%едх|, %еах Get *xp as result 

3 Ltes-l] Фейх, Sed Test xp 

4 cmovll %ейх,%еах ІРО, copy Ü to result 


解释 一 下 为 什么 这 段 代码 提供 的 不 是 deref 的 合法 实现 ， 


GCC 站 前 的 成 本 不 用 条 件 忧 送 来 产生 任何 代 反 。 直 于 期 望 与 以 前 的 486 和 Pentium ЖЕМЕ 
ӘЖ, НЕТ ДЕГЕН. 在 我 们 的 试验 中 ， 我 们 使 用 的 是 上 而 所 示 的 手写 的 江 编 代 二 。 
НЕКЕ ЕЛЕНЕ, - ЕН GCC 工具 在 CC 程序 中 握 入 汇编 代码 的 版 本 需要 17.1 个 周 
期 。 

不 幸 的 是 ，C 程序 员 对 改进 一 个 程序 的 分 支 性 能 是 无 能 为 力 的， 除了 意识 到 数据 相关 的 分 支 会 
引起 性 能 上 很 商 的 花费 。 除 此 之 外 ， 程 序 员 对 编译 器 产生 的 详细 的 分 支 结构 下 和 没有 什么 控制 ， 很 
ETER EMI- E. ЕН, ВИГЕН А. 一 是 编 详 器 牛 成 好 的 代码 ， 尽 量 
碱 少 条 件 分 支 的 使 用 ， 男 一 个 是 处 理 咒 有效 地 分 支 预测 ， 降 低 分 支 质 测 错误 的 数量 。 


5.13 理解 存储 器 性 能 


到 在 前 为 止 我 们 与 的 所 有 代码 ， 以 及 我 们 运行 的 所 有 测试 ， 对 存储 器 的 需求 者 相对 较 少 。 例如 ， 
SALTA ETE 1024 的 向 量 上 测试 那些 合并 函数 ， 数 据 量 不 会 超过 8096 字 节 。 所 有 的 现代 处 理 
带 部 包含 个 战 多 个 高 加 缓存 (cache) 存储 器 ， 以 提供 对 这 样 少量 的 存储 器 的 快速 访问 。 图 5.12 
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ТАА ШИЕ СИНАН e eR EUR (EPI. ТЕ 6 章 中 ， 我 们 会 更 详细 地 探究 高 速 组 
ЛЕДИ ЕН). AR TERIS ЛЛ ЖН И Es НЕЮ. 

在 本 节 中 ， 我 们 会 进一步 研究 加 载 和 存储 操作 的 性 能 ， 我 们 仍然 假设 被 读 或 写 的 数据 是 在 莘 速 
缓存 中 的 。 如 图 5.12 所 示 ， 这 两 个 单元 的 执行 对 间 都 为 3， 而 发 射 时 间 为 1。 迄今 为 小 我 们 的 所 有 
程序 都 只 用 了 如 载 操 作 ， 都 有 这 样 一 信 属 性 ， 一 条 加 载 操 作 的 地 址 依赖 于 对 其 个 寄存 器 执行 增加 如 
作 ， 而 不 是 恢 束 于 另 一 条 加 载 操 作 的 结果 。 因 此， 如 图 515—-[ 518. 8 5.21 Ж 526 Мг, Tin 
载 操 作 能 利用 流水 线 化 ， 每 个 时 钟 周期 开始 新 的 加 载 燥 作 。 加 载 操 和 作 相 计较 长 的 执行 时 间 对 程序 性 
能 没有 任何 负面 影响 ， 


5131 加 载 的 执行 时 间 

作为 一 个 性 能 受 如 载 操 作 执行 时 间 限 制 的 代码 示例 ， 兰 虑 国 数 list_len， 如 图 5.30 Prin. ХА 
数 计算 的 是 -个 链表 的 长 度 . 在 该 函数 的 循环 中 , 变 显 15 的 等 个 连续 的 值 都 依赖 于 指针 动用 1Б->лехі 
读 出 的 值 . 我 们 的 测试 表明 函数 list_ien 的 СРЕ 为 3.0, 我 们 认为 这 是 加 载 哥 作 执 行 时 间 的 直 培 反映 。 
为 了 说 明 这 一 点 ， 来 考虑 这 个 循环 的 汇编 代码 ， 以 及 它 的 第 一 次 迭代 到 操作 的 翻译 ， 





Là: 

incl £&eax incl вах. 0 

тоу1 (X*edx),Sedx load (&edx ü) 

regtl %есах,%ейх testi tedx.l,*edx.1 

ne .12" jne-taken сс,1 

code/opt/list.c 
1 typedef struct ELE { 
2 struct ELE *next; 
3 int data; 
4 } list ele, *list ptr; 
5 
6 int list, lení(list ptr 18) 
7 { 
8 int len = 0; 
9 
10 for {; ls; ls = 189->пехі] 
11 Іеп++; 
12 return len; 
13 ] 
code/optilist.c 


图 5.30 链表 函数 
这 举例 说 明了 加 载 拘 作 的 执行 时 间 。 
АҒ ей 的 每 个 连续 的 值 都 依赖 于 一 个 以 gedx ТӘНЕКЕ ЕЕН Ж. 图 5.31 给 出 的 
怎 这 个 明 妆 头 三 次 适 代 的 操作 的 调度 。 正 如 看 到 的 那样 ， 辑 载 操作 的 执行 时 间 将 CPE 限制 在 了 3.0. 
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5.13.2 


$5t 


周期 
[22] 


图 5.351 SEKICREG EOS PETERS TS BE 
加 载 操 作 的 执行 时 间 和 将 СРЕ ВЕ А ЕЕ r 3.0. 


存储 的 执行 时 间 





tax. 3 


在 迄今 为 止 我 们 所 有 的 示例 中 ， 我 们 只 通过 使 用 加 载 操作 从 一 个 存储 器 空置 读数 据 到 一 个 帘 看 
器 中 来 与 存储 器 交互 。 与 之 村 应 的 ， 存 储 (stoe) 操作 将 个 寄存 器 值 写 到 存储 器 。 目 如 图 5.12 Ж 
耻 的 那 祥 ， 这 个 操作 名 义 上 的 执行 时 间 也 是 三 个 有 周期， 发射 时 间 为 一 个 周期 ， 不过， 它 的 行为 以 及 
它 与 加 载 操 作 的 弃 妆 有 几 个 微妙 的 问题 。 


oo 


ч? 


/* Set element of array to Ü */ 
void array cleartint *src, int *dest, int n] 
{ 

int :; 

for i1 = 0 n; les) 


: 1 
dest[i] - 


© 
0: 
1 


/* Set elements of array to Ü, unrolling by 8 */ 
void array clear 8;int *src, int *dest, int пі 
l 

int i; 

int len = n - 7; 





code/opt/copy.c 
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16 tor {i = Ü; i < len; i+=8) | 
17 dest[il = 0; 
18 dest[i«1] = Ü; 
19 dest [i+2] = 0; 
20 dest [i+3] = 0: 
21 desrt[is4] = Ü; 
22 desr[is5] = 0; 
23 desr[i45) = 0; 
2& dest [1+7] = OÜ; 
25 } 
26 fov ір i < n; l++) 
27 dest[i] - 0; 
28 ] 
一 一 一 一 -一 一 一 一 一 codefopicopy.c 
图 5.32 清 宇 数组 的 沙 数 
WERE T AERE BRE HIKER 


Б ЕЕ, AK Н т, ОТВЕТЕ ВЕЕ ОКНЕ КЕТ. SF AIR 
ДЕВ. РИШ, ЖЕЕ 5.32 中 所 示 的 函数 ,它们 将 一 个 长 度 为 的 数组 des 的 元 素 设置 为 
0。 我 们 对 这 第 一 个 版 本 的 测试 表明 СРЕ А 2.00. 因为 每 次 选 代 都 需要 一 个 存储 操作 ， 所 以 很 明显 
Жи ЬЕ 2 个 周期 能 够 开始 -一 条 新 的 存储 操作 。 为 了 进一步 探究 ,我 们 试 着 展开 这 个 循环 八 座 ， 
如 array, clear 8 的 代码 所 示 。 对 于 这 个 函数 ， 我 们 测量 得 到 СРЕ 1.25。 也 就 是 ， 每 次 迁 代 需要 大 约 
10 外 周期， 并 发 射 8 个 存储 操作 。 因此, 我 们 几乎 已 经 达到 每 个 周期 一 条 新 存储 操作 的 最 优 极限 了 。 

同 到 日 前 为 出 我 们 已 经 著 虚 过 的 其 他 操作 不 同 ， 存 储 操作 并 不 影响 任何 寄存 器 值 。 因 此 ， 诫 其 
本 性 来 说 ， 一 系列 存储 桔 作 - - 定 是 相互 狼 立 的 。 实 际 上 ， 只 有 一 条 加 载 操作 是 爱 一 条 存储 操作 缩 采 
影响 的 ， 因 为 只 有 -- 条 加 载 操作 能 从 出 存 储 操 作 写 的 那个 存储 器 位 置 读 回 值 。 图 533 所 示 的 国 数 
write read 说 明了 加 载 和 存储 操作 之 间 可 能 的 相互 影响 。 这 幅 图 也 展示 了 该 函数 的 机 个 示 鲍 执行 ， 
是 对 两 元 素数 组 a 调用 的 ， 该 数组 的 初始 内 容 为 -10 和 17， 参 数 cnt 等 于 3。 这 些 执行 说 明了 加载 和 
存储 换 作 的 一 些 徽 妙 之 处 。 

在 图 5.33 的 示例 A rh, #3 sre 是 一 个 指向 数组 元 素 a[0] 的 指针 ， 而 dest 是 一 个 指 癌 数组 元 素 
a[1] 的 指针 。 在 此 种 情况 中 ， 措 针 引 用 *sre 的 每 次 加 载 都 会 得 于 值 -10。 因 此 ， 在 两 次 移民 之 后 ， 数 
弓 元 素 腻 会 分 别 保持 固定 为 -10 和 -9。 从 ыс 读 出 的 结果 不 受 对 dest 的 写 的 影响 。 在 较 大 次 数 的 述 
代 上 测试 这 个 示例 得 到 СРЕ 2.00. 

在 图 5.33 Ca) 的 示例 B 中 ， 参 数 src 和 dest 都 是 指向 数组 元 素 a[O] 的 指针 。 和 在 此 种 情况 中 ， 指 
针 引 用 *src 的 每 次 加 载 邦 会 得 天 指针 引用 *dest 的 前 次 执行 存储 的 值 。 因 而 ， 一 系列 不 烽 增 加 的 值 会 
ЕЕЕ. Жин, ШАНИН Ж өтпе теді 时 参数 src 和 desc 指向 同 一 个 存储 器 位 置 ， 页 
参数 cnt 的 值 为 n>0， 那 么 净 效 果 是 将 这 个 位 置 设置 为 n-1。 这 个 示 侧 涪 明 了 一 个 现象 ， 我 们 称 之 为 
写 / 读 相关 (write/read dependency) —— — НЕЕ ИЕ LACER T SE YER ARMAR S. Ri 
的 性 能 测试 表明 示例 B 的 СРЕ 为 6.00。 写 / 读 相 关 导 致 处 理 速 度 的 下 降 。 


code/ept/copy.c 
1 /* Write to dest, read from src */ 
2 void write_readiíiint *src, int *dest, int n) 
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3 { 

d int са, = n; 

5 int val - 0; 

6 

7 while (cnt -) { 

B *dost = vcl; 

9 vài = [*згС)+1; 
10 } 

11 } 


-- — T codefaptfcopy.c 


J. A: write reacisa[l).,sa[l].31 





图 5.33 ЕЛЕР NRE В ИТ 
ОСИП W src 和 dest УИЧ, TERRA Да HI EIS. 


^p f ГАН e АДАА НАРЫ, ELO EA ҰНЫН EL Misia, ЖИЙИ 
ВЛИЯНИЕ ЛА ИМТ PC, 如 图 5.34 Bras. PELES АНАҒА Cstore buffer), 
ERA DCER та лу А uA bei KAILA Җи. XE BOOTE DRE НЕН 
速 缓存 。 提 供 这 样 “个 缓冲 区 ， 使 得 一 系列 存储 操作 不 必 等 竺 每 个 拘 作 更 新 高 速 缓 在 就 能 够 执行 。 
S 条 加 载 操 作 发 生 时 ， 它 必须 检查 存 情 缓 神 区 中 的 条 日 ， 看 有 没有 地 引 相 下 配 。 和 如 虹 有 地 上 直 相 匹 
Mi. OKU TB PVJ S К H TES ЖЕЕ ТЕТЕ Ж. 

Қар а АОИ ЕТЕД АЗАТ ЕТЕРІ F BTS: 


movl beds, becx} slorgeaddr (Зегх) 

storedata %едх.й 
rovl {ЖеЕх},%ейх load {%ерх) tedx. lā 
inci Фейх inc. šedx.la *edx.lb 


сесі $eax dec. Феах,0 ieax.l 





inc .L32 inc-Eaken сс.1 
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Ж 5.34 加载 和 存储 单元 的 骨 玫 
РИТ ЕҢ ТЕЕ ИОВ, пивленияйсинішая TM Ж ЕЕН. Ит. 


ПЕ, AM movl tedx, (&ecx) НЕН THE IE: «езді f$ ir W riba IET GE, 
Bi AARRE ЖН. ЖӘНЕН ІНІҒЕНІ, storedata 指令 设置 访 条 目的 数据 字段 ， 
因为 具有 一 个 存 彤 单元 , matrik R Q FSI FEE), Br UL PIT PED THU ЕНІН LIS. 
正如 我 们 看 到 的 逢 样 ， 这 两 沾 计算 的 执行 基 相 互 莉 立 的 这 一 事 亦 对 程序 性 能 来 说 可 能 根 重要 ， 

*| 5.35 给 出 了 对 于 示例 A НЫ, жүйе тен 的 头 两 侈 选民 操作 的 时 序 。 如 storeaddr 和 load 
Mà TE far] eS EHI EHE, storeaddr WIERE- КІРЕ БІНЕН. ЖБ load SA ix T E 
日 。 因 为 区 珊 个 所 作 并 下 等 价 ， 所 以 load 操作 会 奢 蛙 从 高 速 钥 存 中 读数 据 。 虽 然 存 估 拉 作证 没有 完 
成 ,将 理 器 仍然 能 发 现 它 太 响 的 存 导 器 位 置 不 同 于 加 机 正 试图 读 的 位 置 。 第 二 次 远 亿 仍 会 重复 这 个 
MT. А. ШЕН sloredata 操作 必须 等 特 ， 直 到 加 载 和 增加 了 前 一 奖 迁 民 的 站 果 。 在 此 之 前 
RA. storeaddr BETE load 操作 可 以 比较 它们 的 地 址 是 理 粗 同 ， 确 定 它们 是 不 同 的 ， 就 疤 许 加 副 提 
作 创 读 进 行 。 在 我 们 的 计算 图 中 ， 展 示 了 第 二 次 选 疏 的 加 载 就 在 第 一 交趾 忆 的 加 副 后 1 MG ENG 
Әйт. ШЕҢ ЕрНЕН, MASERA НЕН СРЕ 为 1 心 。 根 明显 ， 某 个 其 他 的 深 源 约束 
SEC I ERE RUM TE T CPE 20 Е. 

8j 5.36 ЖИН TAHTA B НҢ. өтін read 的 头 两 寥 选 代 拘 作 的 时 序 。 同 样 好 ，storeaddr 和 
Кай НЕТ СЕНШЕ ЖЕН, storeaddr Biel at T PRESE CP ER H. ead 安检 查 这 个 条 目 。 
因为 这 些 条 目 都 是 一 样 的 ， 所 以 加 载 必 需 等 待 ， 直 到 storedata 操作 完成 ， 热 后 它 再 从 存 情 规 冲 区 中 
BW. 这 个 等 桂 在 图 中 是 以 load 操作 加 长 了 的 方 框 素 表示 的 ,此 外 , 要 们 展示 了 一 条 从 storedata 
到 ad РЕТИ Е З... "ЕСЕН storedata 055 E WW big 80 load 作为 它 的 语 果 ， 我 们 这 些 接 作 的 时 
FERE DIMUS CPE 60, 和 不过， 这 样 的 时 序 确切 地 是 如 何 出 现 的 ， 还 平 是 完全 清楚 ， 所 以 这 
此 图 内 是 示意 说 明 性 的 , 而 不 是 实际 的 。 通常 ， 处 理 器 / 存 导 器 乒 口 是 处 理 器 设计 申 量 复 划 的 部 引 之 
一 ， 不 查阅 详细 的 训 村 和 合用 机 器 分 析 工 具 ， 我 们 只 能 给 出 实际 行为 的 一 个 假想 的 描述 ， 

ШАЯ ЫТ. FARRER REMANAN. HTAA ННІ 
жн. ГО та REO 3 5 etl. wh. аған ГЫЛ) ME. 
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侍 如 载 和 人 存储 地 址 被 计算 出 来 之 前 ， 处 理 器 都 不 能 预测 呈 些 些 令 会 影响 妇 外 哪些 指令 。 由 于 存储 器 
操作 占 到 了 程序 很 大 的 一 部 分 ， 存 依 器 子 系统 被 优化 成 以 独立 的 存储 器 操作 来 提供 惠 人 的 并 行 性 。 


周期 
中 





mita 
图 5.35 对 示例 大 的 write read 的 时 序 
存 情 利加 载 操 作 朋 不同 的 地 址 ， 因 龙 可 以 不 等 待 存储 就 进行 加 载 。 


Yaax 0 - 
зедх. 0 





store H store 
2 "| daa H addr 


ұғах.2 


3 
4 
5 | 
кеду. la 
6 | . | | 
FE кейк. ID eee ' - load 
m + . 
' КА Ч 
store 
8 data 
9 
10 
11 
tedi., 28 
12 = 
`  %$edx. 2b 
mfi 


536 对 示例 已 的 wite_Ieqd Hs 
仓储 和 加 载 操 作 有 相同 的 地 址 ， 因 此 加 蓓 必须 等 插 ， 直 到 它 可 以 从 存储 蓝 得 结果 了 ， 


Te TELA od fl JH 


ЭШ 58 | MES 
fh ДЕД ЛЙ НЕ Emi. ЖЖтайан EX—TKIBE ЕК МЕ 
| void сару array[int *arc, int *dest, int n] 
š I 
3 int i; 
á 
5 Ғат |1 = Dj; i x ñi ++} 
5 dest[i] = srclili 
了 | 


а ж Е 5 ТОО аа, Akim s T Rq а * f i. 

А. 调用 сору_апву(а+1. a, 999169 ЖАНА? 

B. 调用 copy тауа, a1, 999) Ж £. £ fT 2. ? 

C. Ale e REB CA al á 和 调用 的 CPE Ж 3.00, 而 问题 BB 调用 的 CPE Ж 5.00. e hp dT 
Job gs: Т DLE T 

D. 调用 copy array(a, а, 999 ir] ti Ж a E Y. d t 


5.14 ”现实 生活 : 性 能 提高 技术 

里 热 我们 只 考虑 了 有 限 的 一 组 虚 用 程序 ， 但 是 我 们 能 得 出 基于 如 何 凡 写 高 效 民 码 的 楚 重 要 的 经 
WW. СЕЗЕ T TESEICIERTHITEREm MERE: 

| Sgt. ЖЕНЕШЕ SON HERE RE HE RG. ЖИНИ. ЖЕТЕЛ ЕЛЕШЕ E 
ШЕТЕН ИТЕН НЫ Ж. 

2. ВА ЖӨ. БЕББІЛЕРЛЕЖ, РАТЕ ИЛЕГЕ ААА. 

. ЕЕ АС. шин, ЖИЕНИ ЕЕ. ЕГА ВРЕ ЕВО LI 

АНЕ Xmas. 
* ЗЕЕ ОН. ӨН ЖГ РШ. ӘИЕЛ ЖЕ. 
Ar Е Eos o Еа ШР 

3, ЕЕ, 

. Tunt PPM E. 

4 ITCGPHRGRREEE HOT. 

a ilii To НЕК, КЕҢЕШИ КЕТЕШ PERSE TE- 

ЖЕЕ RE А А, ЖЖ ЕЛЕН ES ARENAL. ШЕНІНЕ, ЯНА 
ЖАШ ER] Ar ÜB, (checking code? 来 测试 代码 的 每 个 版 本 ， 以 确 促 在 这 一 过 程 中 没有 引 六 情 
误 ， 术 查 代码 煌 一 雄 列 到 试 应 用 到 程序 上 ， 确 保 它 得 到 期 望 的 结果 。 当 引入 新 的 变量 ， 改 变 精 环 这 
界 ， 以 及 使 已 码 束 体 更 复杂 时 ， 禄 容易 出 错 。 此 和 外， 注意 到 性 能 上 尾 何 不 同 寻 常 的 或 出 平 意料 的 变 
化 是 银 重 要 的 。 正 如 我 们 已 既 表 用 的 于 样 ， 由 于 性 能 异常 ， 基 准 数 据 的 选择 能 够 在 性 能 比较 中 造成 
ЕККЕН, HARIRA ITH ТЕЗІ. 
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5.15 ”确认 和 消除 性 能 瓶颈 


到 此 刻 为 上 小， 我 们 只 兰 虚 了 优化 小 的 程序 ， 在 这 冬 的 小 程序 中 ， 骨 昌 优 化 的 地 方 很 清楚 。 侍 处 
АХАН, КА РЕВИИ ИРА. ФЕН. ФО Е АН Т ДЬ (сое 
profilers }， 这 是 在 程序 换行 时 收集 性 能 数据 的 分 析 L H. ЗИРЕ А Y ИНЧЕ 1 ИШ, 
称 为 Amdahl 定律 CAmdahl's Jaw). 


5.15.1 程序 剂 析 

BT profiling) 包括 运行 程序 的 这 样 一 个 版 本 ， 其 中 播 入 了 工 其 代 拘 ， 以 他 定 程序 的 首 
个 部 分 需要 多 少时 间 。 确 认 出 程序 中 我 们 涡 要 集中 注意 已 优化 昼 部 分 是 很 有 用 的 。 前 析 的 - -个 有 力 
之 处 在 于 可 以 : 边 在 于 实 的 基准 数据 〈benchmark data) 上 运行 实际 的 程序 ， 一 过 进行 前 析 。 

Unix 系统 提供 三- 个 训 析 程序 GPROF。 这 个 程序 产生 两 种 形式 的 傅 息 。 首 千 ， 它 傅 记 程序 中 
每 个 函数 花费 了 多 少 CPU 有 时间 。 其 次 ， 它 计算 每 个 函数 被 调用 的 次 数 ， 以 调用 前 数 采 分 类 。 这 上 沿 种 
形式 的 信息 部 非常 上 有 用。 这 些 计 时 给 出 了 不 同 函 数 在 确定 整体 运行 时 间 中 的 相对 重要 性 。 调 几 信 息 
使 得 找 们 能 理解 程序 的 动态 行为 ， 

用 GPROF 进行 剂 析 需 要 三 个 步 又， 就 像 所 示 的 对 C 程 序 proge 那样 ， 它 运行 时 命令 行 参 数 为 
füe.txt: 

1, RURSUS TUER. BH GCC (以 及 其 他 蕊 编 详 器 )， 就 是 在 命令 行 上 简单 地 包 
Foe dris hus "-pg". 

unix- gcc -02 -pg prog.c -o prog 

2. HAE ERR DECR FAIT: 

unix» ./prog file.txt 

它 运 行 得 会 比 正常 时 稍微 慢 - д, PERRA EEP Г УСТЕ gmon.out。 

3, 调用 GPROF 来 分 析 gmor.out 中 的 数据 。 


ип1х> gprofí prog 


ТЕ РЕВ RAUS) Y Jay Ж УРЕ СТЕ ЗОНУ 8), ШЕШ ЕҢ. EAS T nË), КТ] 
ШТ РЕА Е LT DET BE. 


% cumula-ive seli self total 
tims seconds seconds calls ma/call ms3/call name 
85,52 7,80 2280 1 1800.00 7800.00 Богі words 
6.29 8.40 0,62 346536 0.00 0.00 find ele rec 
4,50 8.81 1.41 9485965 0.00 0.00 Ісметі 


EIRENE ИАЖ КЫН ТТЕ Ч [н]. 9S3 dede Pr AOT ER НТН) 
EIE E REG. £ su oS А dT 2E EX ^ БІР АВЕ ЖИН. 2€ A orit 
是 花费 在 这 个 函数 上 的 了 时间 , a EDU po BR tt EA ИНК ОЯН АН ЙА). 在 我 们 的 
Гр, (XX sort words 只 被 调用 了 一 次 , 但 就 是 这 一 次 调用 需要 了 .80 ЖЮ. ПОР lower 被 调用 了 
946 596 次 ， 总 共 需 要 041 各， 


前 析 报 告 的 第 一 部 分 给 出 的 是 这 个 衣 数 的 调用 历史 - 下 血 是 一 个 递归 所 数 find, ele, rec 的 历史 ， 
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4872758 find ele rec [5] 
0.60 0.01 948596/945596 insert string {41 
(5] 6.7 0.60 0.0: 946596+4872758 find ele, rec [5] 


0,00 0.01 26940/26946 save string i9) 
0.00 0.00 26946/26946 new ele [11] 
4872758 find ele rec [5] 

RARER TAH find ele тес HAA d os Г ЕЛАН. Te EE Әк, RJ 
В В ЗЕ EAE Y 5819354 IX ETA 9465964872758") —'" Н CWA T 4 872 758 
次 ， 而 函数 insert string. Ciz ЖЯ И T 946 596 次 ) 调用 了 946596 2k, ЖШ find, ele rec 依次 调 
HT AS BS РА save string 和 new ele, УАП p Hoi T 26946 次 。 

根据 这 个 调用 信息 ， 我 们 通常 可 以 推断 出 关 十 程序 行为 的 有 用 信息 。 例 如 ， 函 数 find ele rec 
是 一 个 雍 归 过 程 ， 它 扫描 一 个 链表 ， 查 找 一 个 特殊 的 字符 串 。 想 设 递 归 与 顶层 调用 的 比率 是 5.15. 
我 们 可 以 推断 出 它 每 次 平均 大 约 需 要 扫描 6 个 元 素 。 

GPROF 有 些 属性 值得 注意 : 

s ”计时 不 是 很 准确 。 计 时 是 基于 一 个 简单 的 间隔 计 教 (interval counting) 机 制 的 ， 在 第 9 章 

会 讨论 这 个 问题 。 简 而 言 之 ， 编译 过 的 程序 为 每 个 随 数 维护 个 计数 器 ， 记 录 花 费 在 执 
行 该 盟 数 上 的 时 间 。 操 作 系统 恒 得 每 隔 某 个 规则 的 时 间 间 隔 5， 程序 被 中 断 一 次 。5 的 a 典型 
值 的 范围 为 1.0 一 10.0 毫秒 。 当 中 断 发 生 时 ， 它 会 确定 程序 正在 执行 什么 前 数 ， 计 将 该 阴 数 
“ШИЕ ҢИЛ! 5。 当 然 ， 也 9 能 这 个 隙 数 只 是 刚 开始 执行 ,市 很 快 就 会 完成 ， 却 赋 给 它 从 
上 次 中 断 以 来 整个 的 执行 花费 。 在 两 次 中 断 中 也 可 能 运行 其 他 某 个 程序 ， 却 因此 根本 没有 
计算 花费 ， 

对 于 运行 时 间 较 长 的 程序 ， 这 种 机 制 工作 得 相当 好 。 从 统计 上 来 说 ， 频 该 最 据 此 费 在 执行 疯 益 
上 的 相对 时 间 来 对 每 个 函数 计算 花费 。 不 过， 对 于 那些 运行 时 间 少 于 1 秒 的 程序 来 说 ， 得 到 的 统计 
数字 内 能 看 成 是 粗略 的 估计 值 。 

?请 用 信息 恰当 可 靠 。 编译 过 的 程序 为 每 对 调用 者 和 被 调用 者 维护 一 个 计数 器 。 每 次 调用 : - 

个 过 程 时 ， 就 会 对 适当 的 计数 器 加 1. 
° КИЛ ЛЕ, TAS А ЖЕН. FAHR HERR HAERERE T HHR 
ARKA P. 


5.15.2 ЕМЕН ЖЕНЕ 

作为 -一个 用 乔 析 程序 来 指导 程序 优化 的 示例 ， 我 们 创建 了 一 个 包括 几 个 不 同 任 务 和 数据 结构 的 
程序 。 这 个 应 用 程序 读 一 个 文本 交 件 ， 创 建 -- 张 互 不 相同 的 单词 和 每 个 单词 出 现 次 数 的 表 ， 然 后 接 
明 出 现 次 数 的 降序 对 单词 排序 。 作 为 基 淹 程序 ， 我 们 在 -个 由 荡 士 出 亚 侠 集 组 成 的 文件 上 运行 这 个 
程序 ， 据 此 ， 我 们 确定 莎士比亚 - 共 写 了 946 596 个 单词 ， 其 中 26946 是 互 不 相同 的 。 最 常见 的 单 
KA "the", dU 20801Х. БЫ "love" HIET 2249 Ж, T “death” HB Г 933 Ж. 

我 们 的 程序 是 由 证 列 部 分 组 成 的 。 我 们 创建 了 -系列 的 版 本 ， 从 各 部 分 简单 的 算法 开始 ， 然 后 
再 换 成 更 成 熟 完 善 的 算法 : 

i. 从 文件 中 读 出 每 个 单间 , 并 转换 成 小 写字 母 。 我 们 最 初 物 版 本 使 用 的 是 随 数 jpwerl С 5.7), 
我 们 知道 它 的 复杂 度 是 二 次 的 。 
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2. 对 字符 串 应 用 一 个 喻 希 国 数 ， 为 一 个 有 s CRD 《buckets》 的 蛤 希 表 产生 一 个 07s 1 Z ËB] 
的 数字 。 我 们 最 补 的 画 数 只 是 简单 地 对 字符 的 ASCH AURE, 87 ЖЖ. 

3 每 个 了 哈 希 玫 元 者 组织 成 一 个 链表 。 程 序 消 着 这 个 链表 扫描 ， 寻 找 - TUUM TERH. n ESI 
了 ,说 单 记 的 频 度 就 加 1。 否则 ， 就 创建 一 个 新 的 链表 元 素 。 我 们 景 初 的 版 本 递归 地 完成 这 个 操作 ， 
ROBUR fh cR RE 

4. — D ZEAE Г 3, 我 们 就 根据 频 度 对 所 有 的 元 素 排序 。 我们 最 初 的 版 本 使 用 插入 排序 。 

图 5.37 冶 出 了 我 们 的 单词 频 度 分 析 程 序 苦 个 版 本 的 剖析 结果 。 对 于 每 个 版 本 ， 我 们 将 时 间 分 为 
五 类 。 

Sort: 按照 频 度 对 单 训 排序 ， 

List; ALEHA, WRR. А 个 新 的 元 素 ， 

Lower: HFI ERRANS E 

Hash; i5 0 IE. 

Rest; HAERE HX. 

如 图 中 (a) 部 分 所 示 , EEUU ESTE. ХИТ T ERE. OD. 
因为 插入 排序 有 二 次 复杂 度 ， 向 程序 对 27 000 个 值 进行 排序 。 

ERT- МКЖ, КҮНЕН вол 进行 排序 ， 这 个 图 数 是 基于 快速 排序 算法 的 。 在 图 
中 这 个 版 本 称 为 “Quicksort"。 更 有 效 的 排序 算法 使 花 在 排序 上 的 上 时间 降低 到 可 以 忽略 不 计 ， 而 整个 
运行 时 间 降 低 到 大约 1.2 种。 图 的 (h) 部 分 给 出 的 是 匀 下 各 个 版 本 的 时 间 ， 所 用 的 比例 能 司 我 们 看 
fa ESAE. 

КТ HET. ЯЕ ЖБИ ЕЕ HERR T OR. ЕНХКЖЖЕН А RS ЫН FL ie 
у, ВН АЧ, ШАЛ “ПегҒия”, S АЕ ИНЕ. atrito Т AZ 1.8 
ER. Hg X РИЯ, ЖП Б АРТИ ЕВА [Е PATRE. ЖОНЕ ЖШТ л. AERA 
到 链 胡 尾部 ， 而 达 代 版 本 把 它们 搬 到 链表 头 部 。 为 了 使 性 能 基 友 化 ， 我 们 希望 频率 最 高 的 单词 出 现 
在 链表 的 开始 处 。 这 样 一 来 ， 函 数 就 能 快速 地 定位 常见 的 情况 ， 很 设 单词 在 文档 中 是 均匀 分 布 的 ， 
3213 ШИЕ AARAA - -次 出 现在 频 度 低 的 单词 的 第 一 次 出 现 之 前 。 通 过 将 新 单 训 插 入 尾部 ， 
第 -个 阴 数 倾 回 于 按 咎 款 度 的 降序 排序 ， 和 出 第 二 个 和 函数 则 相反 。 因 此 我 们 创建 第 三 个 合川 这 代 的 链 
志 村 任国 数 ， 不 过 是 将 新 元 素 捅 入 到 链表 的 尾部 。 使 用 这 个 版 本 ， 显 到 为 “Iter Баи”, MERET 
太 约 1 0 种， 比 弟 归 版 本 稍微 好 一 -点 。 

接 下 来 ， 我 们 考虑 哈 希 表 的 结构 。 最初 的 版 本 上 只 有 1021 个 表 元 〈 通 常 ， 会 选择 表 元 的 个 数 为 素 
Wt. UL eR dS HASCE SEES ^] y nite SO PUBEZD. XHE— 1-8 26 946 个 条 目的 天 来 说 ， 这 
КАКА КЫЙ Ж (load) 是 26 9461007=26.4。 这 就 解释 了 为 什么 有 那么 多 时 间 花 在 了 执行 链表 操 
作 上 了 一 一 搜索 包括 测试 人 量 的 候选 单词 。 它 还 解释 了 为 什么 性 能 对 链表 脑 序 这 么 敏感 上 、 因 而 ， 
我 们 将 表 元 的 数量 增加 到 了 10007， 将 平均 负载 降低 到 了 2.30。 不 过 ， 很 奇怪 的 是 ， 我 们 的 整体 运 
iri EPI 1.11 钞 。 齐 析 结 果 表 明 增 加 的 时 间 主 要 花 在 了 小 号 字 妊 转换 函数 上 ， 有 虽然 不 大 可 能 
是 这 样 的 。 我 们 的 这 行 时 间 过 于 短 了 ， 我 们 不 能 期 望 这些 计 时 非常 精 网 。 

我 们 假 或 表 变 大 了 而 性 能 安 差 了 是 因为 哈 希 函数 选择 得 不 人 好 。 简 单 地 对 字符 编码 求 和 不 能 产 
生 一 个 大 范围 的 值 ， 也 不 能 根据 字符 的 分 类 做 出 区 分 ， 例 如 ， 单 词 “god” 和 “dog” 孝 会 哈 希 到 位 
Ж 147+157+144=448, DAE dI HBELES. ЖЫ “foe” 也 会 哈 希 到 这 个 位 置 ， 因 为 
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146+157+145=448, ҰННАН T e HOME E ШНЕК КЕШ. HET QA. Veg "Better 
Hash”, {ШЕКЕН T 0.84 Ж. — T л e ЕЛЕЕ In (T PEE at fe decir s, 
xu dM EH. ЖАЙЫ T ИЛИНЕТ T A VIR. 








GPU ЖЖ 





EI ЕЯ — Em | 
Iter last Big labie Вапа hash Linaar теле 
(а) ҮП Ж 








CPU MEE 





(h: RE TA MERC EL ^ IR 


图 3.4/ ФТТ Ra ИТЕН i IHRER IE TANE EACH ЕЙ 

Mus. SETTE] BERT — ун [и] ЖЕЛЕТ Н ЕЕН ЕТ. 我 们 已 经 看 到 了 函数 
lowerl ЁТЕ Ж, 特别 是 对 长 字符 串 来 说 , ТАЙОТА ДА БШ. (aR С ЖЕЕ quadratic 
performance? КЖЕ Ж; МЕНІ Chonorificabilitudinitatibus") [EC 27 E. ЖЧ 
换 成 使 用 lower2, TEORA "Linear Lower" ТІННЕН, Wë PD] T 05208. 

ЖАТА, RER ҚТ gp — F f ih p РЕВА Е B An [E] M, 9 11 MERE I 
0-52 E—— RESI Г 17.5 悦 。 剖 析 程 序 帮 助 我 们 把 注意 力 信 中 在 程序 最 桂 时 的 部 分 上 ， 同 时 还 提供 
了 区 于 过 程 调用 站 构 的 有 用 信息 ， 

忽 人 可 以 有 有 到， 剖析 是 工具 箱 中 一 个 息 有 几 的 工具 ， 和 但 是 它 不 应 该 是 惟一 一 个 。 计 时 测量 不 是 
撒 准 确 ， 特 别 是 对 较 卉 的 运行 时 间 【 小 于 1 2 来 说 ， 结 果 只 适用 于 被 测试 的 那些 特 焉 的 数据 。 例 
ЖШ, ШЕНГНЕЗЕФЖЕПЕКТТЕНИНЕЕ Берия, RARR SE 
ЮГА ШТЕЙ. Summum. Е HMH AW milii, RHET WEAR ЕЕ НЕШ 
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看 的 性 能 杀手 ， 例 如 lowerl 的 一 次 性 能 。 通 常 ， 稚 设 我 们 企 有 代 志 性 的 数据 土 过 行程 序 ， 前 析 能 帮 
助 我 们 对 典型 的 情况 进行 优化 ， 但 是 我 们 还 应 该 确保 对 所 有 可 能 的 情况 ， 程 序 玫 和 有 相当 的 性 能 。 这 
TERMES EAS SURÉCEEDUSEILTEBE (asymptotic. performance? 的 算法 【例如 插入 算法 》 和 坏 的 编程 
wp 例如 lowerl), 


5.15.3 Amdahl 定律 

Gene Amdahl 《计算 领域 的 完 怠 之 一 ) 做 出 了 一 个 关于 提高 系统 -- 部 分 性 能 的 效果 的 简单 但 症 
窗 有 涧 察 力 的 规 察 。 这 个 观察 丽 在 被 称 为 Amdahl 定律 。 具 主 紫 思想 是 当 我 们 加 快 系统 -- 个 部 分 的 
速 典 时， 对 系统 整体 性 能 的 影响 惰 赖 于 这 个 部 分 有 多重 要 和 速度 提 电 了 和 多少。 考虑 -… 个 系统 ， 企 其 
中 执行 某 个 应 用 程序 需要 时 间 Tuus 和 仍 设 系统 的 某 个 部 分 需要 这 个 时 间 的 百分比 为 a 向 我 们 将 它 的 
性 能 提 启 到 了 大 信也 就 是 ， 这 个 部 分 原来 需要 时 间 aL mme ЖЫН Ват, yk. БІН, SETA 
行 时 间 会 是 


Тек 一 (1 -q) Lu + (OT а)! К 
= Lll - 2) + GZk | 


据 此 ， 我 们 可 以 计算 如 速 S= T.T... А: 
s= 1 (5.1) 
(1- G) ark 
TE Ë], FEAR Pei. АН ЖЫН 6098] (a-0.60 的 部 分 被 提 疡 到 了 3 fü 
(k=3), EARI BME 1Л10.4+0.6/3]=1.67, ЖІ, BERE] A E REPRE T RAERU— L E 7, 
ФАГ ЕУР О И АХ. EXE Amdahl ЖЕМЕНЛН-ӘЛЛИНЕНЕ ТАН, Қ 
们 必须 提 癌 整个 系统 很 大 一 部 分 的 还 度 。 


练习 题 5.9 

假设 你 的 职业 是 卡车 司机 , 放 被 度 俩 运送 一 车 土豆 从 Idaho 的 Boise 到 Minnesota 的 Minneapolis, 
总 距离 为 2500 公里 . 你 个 计 在 速度 限制 以 内 你 开车 的 平均 时 速 为 100 公里 , 整个 行程 需要 25 小 时 ， 

А. 你 在 新 闻 里 听 说 Montana 刚 列 取消 了 它 的 限 违 ， 这 段 路 程 有 1500 公里 。 你 的 卡 丰 可 以 开 到 
每 小 时 150 公里 。 你 这 次 行程 的 加 速 (speedup ) 会 是 多 少 ? 

В. 体 可 以 在 www.fasttrucks.com 为 你 的 卡车 购买 一 个 新 的 满 轮 增 压 器 .它们 有 许多 样式 ， 不 过 
想 天 得 越 快 ， 花 费 就 越 大 ， 要 想 行 程 加 过 达到 513， 你 必须 以 多 大 的 速度 通过 Montana? 


练习 题 5.10 

你 公司 的 市 场 部 门 许诺 你 的 客户 下 一 版 软件 性 能 全 提高 一 个 。 分 配给 性 的 尾 荔 是 就 迹 个 承诺 发 
表意 见 。 你 确定 只 能 改进 系统 805 的 部 分 。 为 了 达到 楷体 性 能 目标 ， 体 需要 将 这 个 部 分 提高 到 多 少 
[也 就 是 ,大 的 值 应 为 多 少 )? 


Amdahl 定律 的 一 个 有 趣 的 特殊 情况 是 考虑 将 大 设 为 om 的 效果 。 也 冲 是 ,我 作 能 够 取出 系统 的 某 
个 部 分 ， 把 它 的 速度 提高 到 时 间 可 以 报 略 不 计 的 程度 。 琅 么 我 们 得 到 
| 


= ---- (52) 
(1- a) 


ш 
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ЖЕ, fitu. ЭПА] ЖЖ 的 多 的 部 分 速度 提高 到 它 所 需要 的 时 间接 近 于 0, WARN 
的 净 增 速 也 仍然 只 为 M0.4=2.$。 当 我 们 用 快速 排序 取代 插入 排序 时 ， 从 我 们 的 字典 程 户 中 就 能 看 出 
这 个 性 能 。 最 开始 的 版 本 花费 它 9.1 秒 中 的 7.8 秒 来 进行 插入 排序 ， 得 到 a-086.. 使 用 快速 排序 ， 
9.1111,.22=7.5， 这 是 白 于 对 初始 版 本 的 剖析 测试 的 不 准确 性 造成 的 。 我 们 能 够 获得 人 的 增 速 ， 这 是 
因为 排序 占 到 了 整个 执行 时 间 的 一 个 非常 太 的 比例 。 

Amdahl 定律 描述 了 一 个 改进 任何 过 程 的 通用 原则 .。 除了 适用 于 提高 攻 算 机 系统 的 速度 之 外 , = 
还 能 指导 一 个 公司 试 着 降低 生产 剃 须 刀 的 成 本 ， 或 是 指导 一 个 学 生 改 进 他 或 她 的 平均 绩 点 。 或 许 它 
企 计 算 机 外界 里 最 有 意义 ， 在 计算 机 拓 界 中 ， 我 们 通常 将 性 能 提高 一 倍 成 更 多 。 只 有 通过 优化 系统 
很 大 的 一 部 分 才能 获得 这 么 高 的 提高 率 。 


5.16 小 结 


盟 然 关于 红 码 优化 的 大 多 数论 述 都 描述 了 编译 器 是 如 何 能 生成 高 效 民 码 的 ， 但 是 应 用 程序 员 有 
很 多 方法 米 协 助 编译 器 完成 这 项 任务 。 没 有 任何 编译 器 能 用 一 个 好 的 算法 或 数据 结构 代 赫 低 效 率 的 
算法 战 数据 结构 ， 因 此 程序 设计 的 这 些 方面 仍 热 应 该 是 程序 员 主 要 关心 的 。 我 们 还 看 到 妨碍 优化 的 
因 豪 ， 例 如 存储 器 别名 和 过 程 调用 ， 严 重 限 制 了 编译 器 家 行人 量 优 化 的 能 力 。 同 样 ， 程 序 员 必 须 对 
消除 这些 妨碍 优化 的 因素 负 七 要 的 责任 。 

除 比 之 外 ， 我 们 还 研究 了 一 系列 技术 ， 包 括 循 环 展开 、 达 代 分 割 以 及 指针 运 复 。 随 着 我 们 对 优 
化 的 深入 ， 研 究 汇编 代位 以 及 试 着 理解 机 器 是 如 何 执行 计算 芍 变 得 重要 起 来 。 对 于 现 代 、 乱 序 处 理 
器 二 的 执行 ， 分 析 程 序 是 如 何在 有 雹 限 处 理 资源 但 是 功能 单元 的 执行 时 耻 和 发 射 时 间 与 口 标 处 埋 器 
相符 的 机 器 上 执行 的 ， 收 获 良 和 多。 为 了 精练 这 个 分 析 ， 我 们 还 应 该 考虑 诸如 功能 单元 数量 和 类 型 这 
样 的 资源 约束 。 

包 全 条 件 分 支 或 与 存储 器 系统 复杂 交互 的 程序 ， 比 我 们 首先 者 虐 的 简单 循环 程序 ， 更 加 难以 分 
机 和 优化 。 基 本 策 团 是 使 循 不 更 容易 预测 ， 并 试 着 减少 存储 和 加 载 操 作 之 间 的 相互 影响 。 

当 处 理 人 旦 程序 时 ， 将 我 们 的 注意 力 集中 在 最 耗 时 的 部 分 变 得 很 重 归 。 代 码 剖析 程序 和 相关 的 
工具 能 帮助 我 们 系统 地 评价 和 改进 程序 性 能 。 我 们 描述 了 GPROF， 一 个 标准 的 Unix 剖析 工具 , 也 
还 和 更 加 复 巡 完善 的 前 析 程 序 可 用 ， 例 如 Intel 的 VTUNE 程序 开发 系统 。 这些 工具 可 以 企 过 程 纵 分 
和 解 执 行 时 间 ， 测 量程 序 每 个 基本 块 Cbasic block). 的 性 能 。 基本 块 是 没有 条 忻 操 作 的 指令 序列 。 

Amdahl 定律 提供 了 对 通过 只 改进 系统 -部 分 所 获得 的 性 能 收益 的 一 个 简单 但 是 很 三 力 的 看 法 。 
收 苦 既 依 束 于 我 们 对 这 个 部 分 的 提高 程度 ， 也 依赖 于 这 个 部 分 原来 在 整个 时 间 中 所 目的 比例 ， 


参考 文献 说 明 

有 许多 关于 编译 器 优化 技术 的 作品 。Muchnick 的 著作 被 认为 是 最 全 面 的 [55]。Wadleigh 和 
Crawford. 的 关于 软件 优化 的 著作 [85] 包 含 了 一 些 我 们 已 经 谈 到 的 内 容 ， 不 过 它 还 描述 了 在 并 行 机 器 
IX БЕЛЕЕ И, 

TX D 8, НАКЕ НИЕ ЕН HD LR RA. ПЕШ ЙИ ЕЕЕ ИЖЕ БН ЕХ] 
Ий АШЫ ЖЕНШ. 9141 Hennessy 和 Patterson 的 著作 [33， 第 3 28], Shriver 和 Smith 给 出 了 
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AMD ЭЯ РЯ 169, AMD ЖИДЕ du ПЖ Н ЖШН HR IL А. 

大 多 数 和 大 丁 计 算 机 体系 结构 的 书 都 讲述 了 Amdahi 220%. Hennessy 和 Patterson #0 # [3325 
关心 的 是 硅化 的 系统 评价 ， 并 提供 了 对 这 个 主题 相当 好 的 讲解 
LE cd 

511 €9€ 

fi ERA HER ARAA EARLE. KARRE A LS ИЖ АЕ АП? A SOS SE 


fi СРЕ 54. 通过 进行 与 我 们 将 抽象 combine! THA ST ЖЕ) combines 相同 类 型 的 变换 ,我 们 得 到 
РА: 


1 Ре Accumulate in temporary */ 


2 void innerdívec ptr u, vec ptr v, data t *dest) 
3 { 

4 int ài; 

5 int length - vec lengthíu): 

6 data t *udata = get vec, start!u]; 

] data t *vdata = дес vec віагі |у}; 

8 data t sum = (дага t) 0; 

9 

10 tor (l = ü; i < length; i++} ( 

11 Sum = sun + udata[il * vdatalil; 
12 ) 

12 *dest = sum; 

14-7) 


3A TERREA Spo КЕ, АЯН ЛЕ ИЖ 3.11 个 周期 ， 其 中 循 坏 的 汇编 代码 如 下 
BF лу: 


udata in “esi, удаа іп 9oebx, iin edx, sum in Фесх, length in Фейі 


1 124; Ipop: 

2 movl (%е51, %ейх, 4}, Феах Get udatali} 

3 inui! (%abx,%edx,4),%eax Multiply by маша) 
4 addl %еах,%есх Add ю sum 

5 incl %ейх itt 

Б cmpl €edi,*edx Compare i;lengih 

7 ji .L24 if «, goto loop 


ERRATEA E: Hl ERU BE НВ ЛАА. aix ло ЖЕМЕЙ. KARE E 463: 
Жа СН КАН. - CREDERE (ЖЕКШЕН) 就 能 开始 了 。 还 假设 更 数 /分 支 功能 单元 
能 执行 简单 的 整数 氨 作 ， 

A. SEXES Se COAT P IE FESTE BIET. movl 指令 翻译 成 一 条 load 操作 。 寄存 器 名 eax ТЕЙ 
BRA. Rb 4p EDS AK еах, 1a 和 %eax,1b。 

B. RE HER frd A НЕШ ЖК yk ТЕРЕ Т МЕ. 

C, 解释 在 什么 因素 限制 了 这 段 代 码 的 CPE 最 好 也 其 能 为 25。 

D. d PRSE. ПӘНІ CPE 为 3.5。 不 需要 检 千 汇编 代码 ， 描 述 将 性 能 限制 在 最 好 情 襄 
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为 每 次 送 代 3 个 周期 的 - -个 因素 。 
5.12 9€ 
编写 习题 5.11 中 描述 的 一 个 版 本 的 内 积 过 程 ， 使 用 四 次 循环 展开 。 


我 们 对 这 个 过程 的 测试 得 到 对 整数 数据 CPE 为 2.20， 而 对 浮 点 数据 CPE 为 3.50. 


А. 解释 为 什么 任何 版 本 的 内 积 过 程 部 不 能 达到 比 2 EKE CPE 了。 

B. 解释 为 什么 对 浮 点 数 的 性 能 不 能 通过 循环 展开 而 得 到 提高 ， 

5.13 € 

Жыла 5.11 CPGE IIT I REGIS ЮРАНЫ, EAKA EA AAH . 
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我 们 对 这 个 运程 的 测试 得 到 对 浮 点 数 的 CPE A 2.25. 描述 将 性 能 限制 在 最 好 CPE Ж 2.0 的 两 个 


BE. 

5.14 %% 

FARMA- ЗА АН, {ПАК Ж k ЕЛ КЕРЕ. ЕРЕН ЗЕ, fui] 
将 代码 转换 成 使 用 选 代 ， 

1 int facríint mn) 

2 { 

3 int 1; 

4 irt resu.t - 1; 

5 

б for íi = n; 1 > Q; i--) 

7 result - result * i: 

5 return result; 

3 } 


Ж ШЕШ. КЕРА САУ СРЕ 数 从 63 降低 到 4， 这 是 在 Intel Pentium ШЕЙН CAH De 


不 过 ， 他 们 还 想 下 得 再 好 一 点 。 
其 中 一 个 程序 员 煌 说 过 循环 展开 ， 她 写 出 了 如 下 代码 ; 
1 int fact už {int л) 
2 1 
3 int 1; 
4 int result - i; 
5 for {1 = n; 1 > D; i--2] + 
Б result = {result * i) * 11-1); 
7 } i 
8 return result; 
9 


) 


T3 ES ДА ЕНДЕР А п ER USED [R| 0, 
А. ЖР ni, faci u2 和 fact 会 返回 不 同 的 值 ? 


B. 给 出 如 何 修 正 fact_u2。 注 意 ， 对 于 这 个 过 程 有 个 特殊 的 窍门 ， 只 要 禾 改 一 个 循环 界限 。 


C. 对 fact_u2 司 用 基准 程序 ， 显 示 性 能 没有 改进 。 你 会 如 何 解释 这 个 现象 呢 ? 
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D. 你 将 循环 中 的 这 行 修 收 为 


6 result = result * íi * (i - 1)); 
f^ джж, MEURT СРЕ 2.5， 你 怎样 解释 这 个 性 能 改进 呢 ? 
5.15 € 


BH ЖЕНЕ Y, du ҮЗІ ЖЖС Sed Cs: 


1 /* Return maximum of x and v */ 


2 int max [int x, -nt y) 

3 { 

4 return [Xx < y) ? y : X; 
5 } 

516 %% 


ТЕҢ ЖҮМінЕ, ШЕШ MERKRA 
val = cond-expr? then-expr : else-expr: 
FS HERO PE P ТЖ АНТЫ 
val - then-expr; 
Lemp - else-expr; 
test - cond-expr; 
if (test) val - temp; 
这 平 最 厂 IEH TRES ЖЕРІН. АЙДЫ 57 为 例 ， 阅 明 这 个 翻 详 合法 的 通用 
517 %% 
HF 面 这 个 次数 计算 的 是 一 个 链表 中 元 素 的 和 ; 


| int іле) sum(list pir ls) 

2 [ 

3 int sum = D; 

4 

5 for i; ls; ls - le-snext) 
6 sum += ls-»data; 

7 returza sum? 

Ë } 


ТАГАЛА ЗАТ ЕРЕН EM F: 


addl 4{%ейх},%еах qovi 4{%ейх.й) 


142; 


addl %.1,Жеах. ( 
novl 1%ейҳ) ,%®едх load |%ей4х.0) 
teati Z£edx,'*edu tesrtl Фейх. 1, епйх, 1 





пе „Lgi jüe-taken cc.! 
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А. 按照 疼 5.31 АЛ, ШЕ DEBE TER A КАЈА РЕТ. [B8 FRA П А yu. 
B. 我 们 对 这 个 函数 的 测试 得 到 CPE 为 4.00。 这 与 你 在 A ЖЯ РШЕ S? 

518 ФФ 

МЕНМЕН 5.17 тл EET AI AEH: 


1 int list_sum2(list_ptr ls} 
2 l 

3 int sum = 0; 

4 list ptr old; 

5 

6 while ila) | 

7 old = ls; 

Ë 15 = ls-»next; 

9 Sum += old-»data; 
10 } 

li return sum; 

12  ] 


IX BMG SX. (ОНИ КТ BER TCR £r ГІНЕ Р Ss CUR CREE BUR Ee fa 
器 访问 。 
箱 环 的 汇编 代码 和 第 一 次 丢 代 到 模 作 的 翻译 如 下 : 


novl *edx,€*ecx 


novl í($edx),S$edx load (*edx.0) 


add] i(*ecx],€eax movi 4i(&edx.ü] 


addl 5.1,%вах.ф 
tegtl &edx, tedx testl *edx.l,Xedx.1l 


jue .148 ;ne-taken сс.1 





MEE, АЛАКЕ movl %ейх, зесх 不 需要 用 任何 操作 来 实现 。 它 的 处 理 只 要 简单 地 将 
标记 eqx.0 与 寄存 器 %ecx 联系 起 来 ， 这 样 一 此， 后 面 的 指令 addl 4 ($ecx) ，%eax 就 会 被 翻译 成 
Дей fE Ar od Be EA 

A. ЖК 5.31 的 风格 ， 男 图 说 明 御 环 天 三 次 选 代 的 操作 的 调度 。 回 想 一 卡 只 有 - 信 如 载 单 元 。 

B. 我 们 对 这 个 了 阅 数 的 测试 得 到 CPE 为 3.00。 这 与 你 在 A 部 分 中 面 出 的 图 一 敏 吗 ? 

С. XX RACES I 5.17 中 的 函数 怎样 更 好 地 利用 了 加 载 单元 ? 

5.19 Ф 

假设 给 了 你 一 个 任务 ， 要 提高 一 个 出 3 不 部 分 组 成 的 程序 的 性 能 。 部 分 上 需要 整个 运行 时 间 的 
20%, $84 B 需要 3090. КЕЛСЕ 50%。 你 确定 1000 美元 能 将 部 分 B 的 速度 提高 到 3.0 倍 ， 
也 可 以 将 部 分 己 的 速度 提高 到 1.5 悦 。 哪 种 选择 合 使 性 能 最 大 化 ? 
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练习 题 答案 


练习 题 5.1 ЕЖ 
这 个 问题 说 明了 存 悄 器 别名 的 某 些 细微 的 影响 。 
ЕКІНІШІ ГЕ А, ЕСЕН хр 处 的 值 设置 为 0: 
1 хр = *xp + *xp; /* Zx */ 
*xp - *xp; /* 2x-2x = Ü */ 

ÀJ *хр = "Xp - *xp; /* 0-0 = Ü */ 

XX ^" BH GB RAP [S ЕДЕТ UTE E ЕҤ. ВАПА НАТ xp BI yp 是 不 同 的 
情况 ， 却 忽略 了 他 们 相等 的 可 能 性 。 错 误 和 通常 源 自 程序 员 没 想到 的 情况 ， 


练习 是 5.2 答案 
这 个 问题 说 明了 CPE 和 绝对 性 能 之 间 的 关系 。 可 以 用 初等 代数 和 解雇 这 个 问题 。 我 们 发 现 对 于 
<2， 版 本 ] Fih. IT 3<n<2， 版 本 2 最 快 ， 而 对 于 п>8, NUR 3 最 快 ， 


һә 
x 
可 

1 wy H 


ЖЫ 5.3 ЖЖ 
这 是 个 简单 的 练习 ， 但 是 认识 到 一 个 for (АРКАМА) СЮ. SU. “ЭЛИҢДИ Ж) 执行 
的 次 数 是 不 同 的 很 重要 。， 


| WE | mn | max | inr | square | 





练习 题 5.4 答案 


正如 我 们 在 第 3 章 中 发 现 的 ， 从 汇编 代码 到 CC 代码 的 逆向 工程 提供 了 对 编 诺 过 程 的 有 用 见识 。 
下 面 为 代码 给 出 了 对 才 通 用 数据 和 通用 合并 操作 的 形式 ; 


1 void сотоіпеврх8 (чес ріг v, data t *dest) 
2 { 

3 int length = vec length(ív!; 

4 int limit = Iength - 3; 

3 data t *data = get vec startív); 

5 data tL x = IDENT; 

1 

Б 


int i; 
9 ж Combine š elements at a üme */ 
10 for {1 = J; i < limit: i«-H) fÍ 
11 X = X OPER data[0] 
12 OPER аата [1] 
13 OPER data[Z] 
14 OFER даїа[3] 
15 OPER datal4] 


15 OPER data[5] 


优化 程序 性 能 383 


17 OPER data[$] 

18 OPER дага [7]; 

19 data -= 8; 

20 } 

21 

22 f* Finish any remaining elements */ 
23 tor (1 < length; 1++) ( 
24 X = X OPER data[U]; 
2б Даба++; 

26 ) 

27 *dest = x; 

В } 


ВРЕ НЕЕ ЧР ЕЕЕ ЖШ, БИНЕ КЕШ. ЗҰН- УЛЕС ЕШНА 
TAERA НО НЕЕ ТРАН ТУЙ, 


练习 题 5.5 答案 

游 出 的 spilled) 值 通 常 存储 在 本 地 栈 帧 中 。 因 此 ， 它 们 相对 于 %ebp 的 偏 移 为 负 。 我 们 可 以 在 
汇编 代码 中 第 12 行 上 看 到 这 样 一 个 引用 。 

A. 变量 limit 被 溢出 到 栈 中 。 

В. 它 在 相对 于 免 ebp 偏 移 为 -8 处 。 

C. 只 有 在 确定 是 否 会 选择 结束 循环 的 j| 指令 时 才 会 需要 这 个 值 。 如 果 分 支 预测 逻辑 预测 会 选择 
分 文 ， 那 么 下 一 次 欠 代 就 能 在 循环 测试 完成 之 前 进行 。 因 此 ， 比 较 指 令 不 是 确定 循环 性 能 的 关键 路 径 
的 一 部 分 。 此 外 , 习 为 这 个 变量 不 会 在 循环 中 被 改变 , 所 以 把 它 放 到 栈 中 不 需要 任何 额外 的 存储 操作 。 


练习 题 5.6 答案 

这 个 问题 证 明了 程序 中 很 小 的 改动 是 如 何 能 够 造成 巨大 的 性 能 差异 的 ， 特 别 是 在 乱 序 执行 的 机 
АЕ Co 图 5.38 表 未 了 函数 针对 每 种 结合 的 一 次 迭代 的 乘法 操作 的 调度 。 每 次 氨 代 包括 三 个 敢 法 , 而 
每 个 乘法 接收 的 内 值 (显示 为 x0》 并 计算 一 个 新 的 值 (显示 为 n1)。 不过， 如 灰色 虚线 所 示 ， 关 
键 路 径 〈critical pathy， 也 就 是 对 的 连续 更 新 之 间 的 最 小 时 间 可 以 是 12 (А1). 8 (A2 和 AS) 或 4 
САЗ 和 A4)。 假 设 处 理 器 达到 最 大 的 并 行 度 ， 那 么 只 有 这 个 关键 路 径 会 限制 CPE 的 理论 值 ， 

这 会 得 到 下 面 的 表 ; 





从 这 张 表 我 们 看 出 结合 Al1、A2 和 AS 达到 了 它们 的 理论 最 优 值 ， 而 A2 和 АЗ 每 次 达 代 要 花费 
5 小 周期 ， 而 不 是 理论 上 的 最 忧 值 4。 





图 538 问题 5.5 rÉCR EL ЕТЕНЕ 
灰色 虚线 表示 限制 变量 r E P E Si 2 ШИШИ КЕЕ. 


练习 题 5.7 答案 

这 个 问题 证 明了 当 使 用 条 件 传 送 时 需要 小 心 .它们 要 求 对 源 操作 数 求 值 ， 甚 至 于 在 不 使 用 这 个 
(ҢІН. 

这 段 代 码 总 是 间接 引用 хр 《汇编 代码 的 第 2 行 )。 dE xp 为 0 的 情况 中 ， xS SET ERIS 
H. 


练习 题 5.8 答案 

这 个 问题 要 求 你 分 析 个 程序 中 潜在 的 load-store 25 H +E HI, 

А. Во 720 api] EA Hl, 0<1<998. 

B. 它 会 将 每 个 元 素 af 设置 为 0， 0<1<999. 

C. 在 第 二 种 情况 中 ,一 次 夺 伐 的 加 载 取 决 于 前 次 夺 全 存储 的 结果 . КІР, ЕЛЕНА ІН 
写 / 读 相关 。 

D. 它 会 得 到 СРЕ 5.00， 因 为 存储 和 和 后续 的 加 载 之 间 没 有 相关 ， 


练习 题 5.0 = 

这 个 问题 说 明了 Amdahl 定律 不 仅仅 内 适用 于 计算 机 系统 ， 

A. 按照 等 式 5.1， 我 们 有 a= 0.6 к= 1.5. S PLU IE, Fil Montana ГН 1500 25 EAE 10 
个 小 时 ， 而 剩 下 的 行程 也 需要 ]0 个 小 时 。 这 会 得 到 增 速 25K10+10)=1.25。 

В. ARFA 51, 我们 有 а= 0.6. П jm E S=573， 根 据 这 些 我 们 可 以 解 出 上 ， 更 直观 地 说 ， 
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为 了 使 行程 加 速 3%3， 我 们 必须 将 整个 时 间 降 低 到 15 个 小 时 ， Montana 之 外 的 部 分 仍然 需要 10 个 小 
时 ， 所 以 我 们 必须 在 5 个 小 时 内 通过 Montana。 这 要 求 行驶 速度 为 每 小 时 300 公里 ， 对 于 卡车 来 说 


实在 是 太 快 了 ! 


练习 题 5.10 答案 
通过 一 些 示例 是 理解 Amdahl 定律 的 最 好 方法 。 这 个 例 子 要 求 你 从 - :个 不 同 寻 常 的 角度 来 看 等 


X 5.1. 
这 个 问题 是 这 个 等 式 的 一 个 简单 应 用 。 给 定 $=2 和 o=0.8， 而 你 必须 解 出 大 
1 
(1- 0.8) +0. 8/& 
Q4 L&6k = 1.0 
k = 267 


2 = 
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3 H si AL, АТА А АРЫҒА, RIET CAERE ARAR, CPU 执行 指令 
而 存储 器 (memory) 系统 为 CPU FREGARE., ТИЕ АЯҢ, ЕЕЕ ДЕ CERTE 
的 字 节 数 组 ， 而 CPU ЕРТЕ ODE EA SE F F u Е, m tiep PK al TEXT 
SUM, PECHA КАМКА SEC s 1 作 的 方式 。 

实际 上 ， 存 储 器 系统 (memory system) 是 一 个 具有 不 同 容量 、 成 本 和 访问 时 间 的 仓储 (storage) 
设备 的 层次 结构 。CPU 寄存 器 保存 痊 最 常用 的 数据 。 菲 近 CPU УАН ТЕП 38 Ж 44i 25 (cache 
memory? EA Ai (stored) НІН ЕТТИ (таш memory, Es 3-460 m EGGS DE 
ШЕ. ЖЕТ ЕЕН ТЕ КЕЛ ШЕ BENE ЕЕЕ X E NA ИТ: ДИ 
48 X He R bil asua ЯЙ H LR] A d EE REPOS . 

А КАЕ ТЕ, ААА К 个 更 低层 次 的 存储 设备 相 比 米 说 ， 一 个 编写 民 好 的 
程序 剧 向 丁 更 频繁 地 访问 某 一 个 层次 上 的 存储 设备 。 所 以 ， 下 一 后 的 存储 设备 趾 以 更 慢 速 一 i 以， 也 
因此 更 大， 每 个 位 更 便宜 。 整 体 效果 是 “个 大 的 存储 恬 池 ， 其 成 本 与 层次 结构 底层 最 便 官 的 仓 情 设 
备 相 当 ， 但 是 却 以 接近 于 层次 结构 硕 部 仓储 设备 的 遍 速 率 占 程序 提供 数据 。 

伍 为 一 个 程序 员 ， 你 需要 理解 存 竺 器 层 议 结构 ， 因 为 它 对 你 应 用 程序 的 性 能 有 者 已 太 的 影 串 。 
如 果 你 的 程序 需要 的 数据 是 存储 在 CPU 寄存 嚣 中 的 , 那么 在 执行 期 间 , 在 零 个 周期 内 就 能 访问 到 尼 
们 。 妇 果 存 储 在 高 速 缓 在 中 ， 需 要 1 一 10 个 周期 。 如 果 存 储 在 主 在 由， 需要 和 一 100 个 周期 。 而 如 
ЖЕНЕ D. d = K£ 20000000 个 周期 ! 

XA Hg АЛ ELLAS SE ЗАТ ALB RAS. WERKER T Жл HR ЖЁН А fe ба ЖЕ Pa tk 
afr. LI FEAR. ЛАЙ АБЫ ЕН ЕНУ ЛЕН.) S C TI ЕТИН {ЕБ РКИ Emi 
ШЕЛ, {ЕЛ Н CPU Rë E Po S f] “ГЕЛІ. 

这 个 思想 围绕 着 计算 机 程序 的 ”个 称 为 局 部 性 Qocality) 的 基本 属性 。 具 有 展 寻 局 部 性 的 程序 
ШЕЛ :次 又 “ 识 地 访问 相同 的 数据 项 集合 ， 或 是 倾向 于 访问 邻近 鸭 数 据 殴 集合 。 有 共有 民 好 局 部 性 
的 程序 二 局 部 性 着 的 程序 更 多 地 倾向 于 从 存储 器 层次 结构 中 较 高 层次 处 访问 数据 项 ， 因 此 和 运行 得 更 
快 。 例 如， 不 同 的 御 阵 乘法 核心 程序 执行 相同 数 量 的 算术 操作 ， 伍 是 有 不 同 程度 的 局 部 性 ， 它 们 的 
运行 时 间 可 以 相差 6 倍 ! 

在 本 章 中 ， 我 们 会 看 在 基本 的 存储 技术 一 SRAM 存储 器 、DRAM 存储 器 、ROM fr A 
咒 一 一 并 搭 述 它们 是 如 何 被 组 织 成 层次 结构 的 。 特 别 地 ， 我 们 将 注意 态 梨 中 在 CPU 和 主 相 之 间作 
为 缓存 区 域 的 疝 速 缓存 存储 器 上 ， 因为 它们 对 应 用 程序 性 能 的 影响 最 大 ， 我 们 同和 你 展示 如 何 分 析 
傣 的 C 程 剖 的 局 部 性 ， 而 县 我 们 还 介绍 改进 你 的 程序 中 及 部 性 的 技术 。 你 还 会 学 到 一 种 描绘 某 台 
机 髓 “存储 占 层 识 结 构 的 性 能 的 有 趣 方法 ， 称 为 “存储 器 山 (memory mountain)”, 125 H SE Jj 
| CR ЕЛЕНЕ RR 
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计算 机 技术 的 成 切 很 大 程度 上 小 自 二 存储 技术 的 巨大 进步 。 早期 的 计算 机 只 有 用 千 字 造 的 随机 
访问 存 司 器 。 最 早 的 IBM PC 甚至 于 没有 硬盘 。1982 年 引入 的 了 MPC-XT & 10M E Mir, #l 
2000 年 ， 主 流 机 器 已 有 1000454 PC-XT 的 磁 冀 存 情 器 ， 而 且 这 个 比率 会 只 每 两 年 或 :年 10 fit] 
速度 增长 。 


| LELEA 380 
_ зен ы 38 
611 Rif ibis feld 

MLP Н] S Crandom-access memory, RAM) 分 为 两 类 一 ds йай s. Wis RAM 
(SRAM? 比 动 态 RAM (DRAM) Ж, {Н Н, SRAM REX PE SERIE EMEN. Шир 
CPU 芯片 上 ， 也 可 以 不在 CPU # W Е. DRAM И ЖЕЗ E rtl RES ЕШ ЕХ. domas, 
“ШЖМ SRAM 不 会 超过 几 兆 字 节 ， 但 是 DRAM HI LEE T dE W, 

5 RAM 

SRAM Fri [I EE Tr Бе) bistable) FARAT (сеп) g. Д ДА H — 428 
W TN ЖЕН. ЗВТ TME. 它 可 以 无 限期 地 保持 在 两 个 不 同 的 电压 配置 

(configuration) AS [state》 之 一 。 其 他 任何 状态 都 是 不 稳定 的 一 以 那里 开始 ， 电 路 安 迅 速 地 
竺 称 到 丙 沾 稳定 状态 中 的 一 个 。 这 样 一 沾 存 МЕЛ ЖЫЛҒЫ бі rni d m ied eR. 

司 钟 捍 眉 料 到 最 左边 或 最 右边 时 ， 它 是 稳定 的 。 从 其 他 任何 习 置 , 圳 控 邦 会 例 向 一 边 或 另 一 边 。 
ИШЕ. ФИ ЕНЕ E FEM EIE DR GER TH Ж UG HE E 5] (metastable) 一 最 
下 向 的 就 动 也 能 他 它 倒 下 ， 而 且 一 旦 倒 下 载 永远 不 会 再 恢复 到 重 真 的 位 轩 ， 

由 于 SRAM 存储器 单元 的 双 稳 志 特 性 ， 内 要 有 电 ， 它 就 妆 示 运 地 保 转 它 的 年。 Wi rd. m 
шщ, ЖАНАК. THOME RE, BEAR E f. 
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同 SRAM ME- (HE НҮП HH PH s d 

动态 RAM 

DRAM fi^ fei ee E. i bb, NAH TH KH Т ЛЛ THER 
BE, 30х10 ER. ЖИ. BEIM — Fikit ВЕЕ ЦЬ, DRAM {Жү uiii) 
AERE RB T- orci — Е 4 Uri B ER. (3S. 5 SRAM ТІҢ, DRAM ЕМЕ 
ЛР ЕИ. заана > Е. КШТ Т. ВДИ КЕНЕНИН 
Ba. EEE. ЗОНЕ Е ЕИБ. DRAM 8 rc PER RI. 

ЖЕНЕ DRAM 单元 在 10—100 ЖЕКЕН ЇЙЇ Н ЖЩ. ig. impiis 
ГЇН ЖЕАР ЖИДЕ. ip X RE I ер. FEART HE АПЫ W] tk E ЖН 
т ЖН fr f B PERITI (r.p Eb 3 ИНН ШЕ ЕҢ. Hrhi Wil e E IL CO 
ШІ, 32 位 的 字 可 能 用 38 位 来 编码 》， 这 样 一 来 ， 邮 路 可 以 发 更 并 划 正 一 个 字 中 任何 单个 的 错 说 位 ， 

ІҢ 6.2 BS T SRAM 和 DRAM КЕНЕН, RENA, SRAM ЖЕН, 与 DRAM ЖЕ. 
ETEEN. SRAM 的 存 取 比 DRAM tt, SRAM trm ER BM ikili KORI. Feld 
SRAM 单元 比 DRAM 单元 使 用 更 赦 的 吊 体 管 ， Bina АЖЕ. HER, ҢА. 


татты 
js. ны 


8.2 DRAM 和 SRA НИН 





常规 的 BRAM 

DRAM GA PEAT OM) РАА AEE (supercell), SARTRE h w DRAM ñ 
ЛАЙТ, —* dXw 的 DRAM 总 失 存储 了 dw ЧЇЙ. MATRE ride 列 的 长 方形 阵 
H. ДАҢ reed. ЧЫ UE Жш, nh, ЖЕ) ЖЕТІП, 而 nj. 

Иш. PH 6,3 Rog HE 16X8 的 DRAM 芯片 的 组 织 , 有 dalo EDGE, pP DIOE най 
Ë, r=4 FT. c=4 列 。 带 并且 的 方 框 表示 地 址 (2,1} 处 的 超 单 元 ， 信 息 通过 称 为 管 脚 (pin) 的 外 部 过 
RA г. SHEETS. HAETAAN ET dan ЖЫ, ë 
ПТВ P635 — T7 Wala Hr LA S HU. ELE 24+ ай TERI, ПЖ 2 {ЖИТ ШШЕ 
元 地 考 。 其 他 摘 硕 控制 信息 的 管 著 役 有 显示 出 来。 


HR 
12.1) 





ЕЗ — 120 {0 16x8 ff] DRAM 蕊 片 的 高 级 视图 
ЯН. FRERE ， 
AANER RLA A DRAM BEHEEAE—PHERALAT. TU NORMA HERE “Ял, 


(eel 让， 使 这 沾 来 语 具 有 DRAMAS AZ $. ДИФ NT Ex "F (waq. 2 R$ EA 
-AFE PTAGUGOR, ANRAT AAH RE "ИЯЛ, (supecell P, 


Mi DRAM Ж ЕЕ Ж ЖИ S A EM EDU. Ed Г dE ERE Ww АНЕ 

RAM 5/125 — ЖАР DRAM ЖИЕН із. Ж T bd dg ou nde. 存储 控制 器 理 行 地 址 

i MISR DRAM. ЖЕЛЕРИН j, DRAM felt conteste | er av. (Ті; 

КЛ) RAS (Row Access Strobe, 行 访问 选 通 脉冲 7 请 求 , 列 地 址 了 ЖК CAS CColumn Access Strobe, 
МАЛЫЙ?) 请 求 。 注 意 RAS 和 CAS 请 求 共享 同样 的 DRAM ЖЕНЫ. 

Pu, ЖШ 63 中 的 166 的 DRAM 中 读 出 超 单元 (2,1)， 存 储 控 制 器 爱 间 行 地 址 3， 加 图 6.4 

(а) 所 示 ，DRAM 的 响应 是 将 行 2 的 整 直 内 容 三 拷贝 到 一 个 内 部 的 行 缓 冲 区 。 接 下 来 ， 存 情 掉 制 
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EREA 1. ШІН 6.4 (b) т. DRAM IF Br e А P CHE Т B EA OD Lp В {й. dE 
把 它们 发 送 到 存 赃 控制 器 . 





ЕПТІ 
(b) БАІ (CAS iE) 


Шіл 读 一 个 ОРАМ 超 单元 的 内 容 


电路 设计 者 将 DRAM 诅 识 成 二 维 阵 列 而 址 是 线性 数 姐 的 一 个 原因 是 降低 蕊 片上 地 址 管 邯 的 数 
WM. fam, XE RHET DU 128 位 DRAM 被 组 织 成 一 让 16 小 起 单元 的 线性 玖 组 ， 地 址 为 0—15. 
У iT METER. =: TELE POR n RPR SOLES NE, ВТ 
Vi ip ind fii], 

нт 

DRAM ФЕ АЕ А Е (memory module) 中 ， EX E RESI E. ELS GM GG 
后 168 ҰНЫНАН АМЕ (Dual Inline Memory Мойше, DIMM), "E Ll 64 r bb de 8 
SET REESHH ERI M e ЕНЕ. ЖН 了 HE EILAE A d e A CS (Single Inline 
Memory Module, SIMM). "ЕШ 32 1 e IEEE. 

[Н 65 ГЕ ЕВА НБ Еи, ян ИНА /\ 64Mbit 的 8M X 8 的 DRAM eH. 
总 共存 傅 GMB (ZW), ЗНН SN 0-1. 每 个 超 单元 存储 主 存 的 一 个 字 节 ， 而 用 和 应 
天 单元 地 址 为 [ij) 的 八 个 超 单元 来 表示 主 存 中 字 节 地 址 A 处 的 64 ARF. EE 65 中 的 示例 中 ， 
DRAM 0 存储 第 一 个 CERO EW, DRAM 1 存储 下 一 个 字 节 ， 舍 此 类 排 ， 

СНР ЊЕ A 处 的 一 沾 64 性 驱 字 ， 存 彤 控制 器 将 A PH Tg coe o, ЖИТ: 
БЕЗИНЕ НИ. IE TEREBS MER г ГНЕ DRAM. 作为 响应 , 每 个 DRAM 输出 它 
的 (i) 超 单 元 的 8 位 内 容 。 策 块 中 的 电 趾 收 焦 这 上 感 输出 ， 并 把 它们 癌 间 成 一 个 64 个 观 字 ， Bs lal e 
da cd. 

WIN ETM WEBSITE, тиже. 在 这 梓 情 况 中 ， 当 控制 器 收 到 一 个 地 
ШАЮ. СЫНАН А ОН А, ЖА SAUCE ЛОТ ОВЕ, HEMER p| Hu k, 








| TAR ЖЕ 64 (39 "ГР". 
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ЖУ 6.1 

EFTA, FF 表示 一 个 DRAM ER F if. ст. b K ДАҢ. ATH 
FAE W di РТО DRAM 88 T 2 ЖШН ЕН HEC. PE malb, bb] 最 小 ,maxib, b.) 
TARRAA tr hulk bi ks. 


sr {гом = 1. COL w 1) 


口 : Sh dup 





Кы п 
Ei T RM X RI 
| DRAM FM] sau 
- ишш 
I— 1 
Bm63 .35404 Te P 16-23 ыз ікТ 
| i | e е б 
ЕЗ FT AB 4T Zar 1: 21 e4 83 "1 ЕТ 
=F =т= ІТ. i 


—À 
w 


к.-4- LZ DELI 
| {ч PES А ЗН TAT | 


5 CPU ҤЕ 64 f 77 


més ЕТИ 


增强 的 DRAM 
HITER DRAM 存储 器 ,而 生产 厂商 试图 跟 上 迅速 增长 的 钼 理 器 速度 , i F sü ІНІ 
НА. WERDE ET Pese СОКАМ 单元 ， 立 进行 了 一 些 贫 估 ， 改 进 了 访问 基本 DRAM 单元 的 速度 ， 
. FPM DRAM (fast page mode DRAM. RIEA DRAM). (ЕН DRAM 38r) Т 
W BI ИТЕН, (EIS. RIS EL. FPM DRAM irai- free 
ui fap eT EI RA PT PS PERRO. MAHT ia a fln. REAL —4ЧЕ ЕЖЕ) DRAM 的 行 
{ЕШШ л. ЕП o xum RASCAS 请 求 ， 即 全 是 行 地 址 i 在 每 沾 情况 中 
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BERE HEIL. F FPM DRAM 的 同一 行 中 该 取 直 单元 , 存 销 控制 骂 发 送 第 一 个 RASICAS 
МЖ. MERSI CAS WR. FR RASCAS 请 求 将 行 i 撞见 到 行 凯 冲 区 ， 并 返回 第 一 个 
起 单元 , 搂 下 来 三 个 超 单元 直接 从 行 细 串 区 获得 上 服务， 因此 比 开 始 的 超 单元 更 快 ， 

* EDO DRAM (extended data out DRAM. ЖН ЫШ DRAM). FPM DRAM 的 一 本 增强 
PES. ESTAS CAS TSS AH КИЕ Е — 

• SDRAM synchronous DRAM, ВЗ DRAM)。 就 它们 与 存储 控制 器 通 凡 杆 用 一 组 显 起 的 控 
SHE Kim, TUN. FPM 和 EDO DRAM 都 是 异步 的 ，SDRAM НЕ ЕЕ ЕЮ ІҢ 
PRS REB EH S P L RIC UT TIK SE SES. ТЕЧЕТ ЕИ Bš W 
ЖАН SDRAM fies Ec EE Rob 034p ih CE Hore НЕЛЫН Ё тн. 

* DDR SDRAM double data-raie synchronous DRAM, 361 Ф 5 # DRAM). DDR 
SDRAM 是 对 SDRAM (i Muss. oui SEDET ERE RE UAE HEU RO E. АЛ 
DRAM 3$ rris (5 . 

* Rambus DRAM (RDRAM). 这 是 只 一 种 私有 技术 ， 它 的 最 大 带宽 比 DDR SDRAM 的 更 高 。 

* УКАМ RAM (Vidéo RAM, WA). ЕЛМЕНЕН, VRAM ІН ШАН FPM 
DRAM 101. Bip L RIC SIR. CÜVRAM Ei Hh acd OG a Н КҖ P3 lcd RT 
ENR: GOVRAM ЖІЛАНТИНӘНІННЕНІЗ. DIE. RALES К-КЕ 
їй CHO By. НИЛ ЖИН С). 

Xf. DAAM I ЖЖ ТИНЕ 

直到 1995 +, X $t РС 都 是 周 FPM DRAM НЕН, 1996--1999 4-, EDO DRAM 在 市 场 上 占据 了 
R, < FPM DRAM (FA P EGET. SDRAM AFARA 1905 4 E EP. жын OD Ж. kE 
Ж PEREN SDRAM # DDR SDRAM 制造 的 . 


кми 

ШЖК Н, DRAM 和 SRAM z NIMM. METRE ES CHIESA (volatile). 
5 Hi. ERRARE (nonvolatile memory) MAREEN, Ds emmmÁ ü. AR 
ЖЕК КНМ. НЕЕ ЕН, 35 ROM Prin S BER ELSE, Bid m rr 
ШИЯ ROM (read-only memory. F k.A ME 80. ROM ECL ПЕШЕР! (E) Fr Br 
ЕНТ ЕЙ FE ИЕ ЖК АЈ, 

PROM (programmable ROM, TRH ROM) HEBEL —К. PROM Фа (йке), 
Жат. НЕ RE iE X. 

EPROM (erasable programmable КОМ, 5 TAH ROM) А ЖП, feli 
lik fe Mou. ЖУК ЖИШП. EPROM 单元 就 被 清除 为 站 。 对 EPROM 编程 是 通过 使 用 一 种 
把 1 А EPROM 的 特殊 设备 来 完成 的 ,EFROM ЙЕНЕ RRE ІШЕРДЕН СЕТІН 1000 
К. EEPROM electrically erasable PROM., % а PROMO ЖТ EPROM. IBECAGE E — 
TER Ld iri HF UE. алы ИЕ EHE E EFE. EEPROM MESE RE UA Fë ЖОЙ 
ЖЕГЕ ПР Ж. 244 (Bash memory) -ARER КЕНЕШ. ЖТ EEPROM， 它 可 以 插 
Хан. Tip NUNG EE EE. ELEM, FH FAR. 

МНЕ ROM Bri (ШЖ ЛЕШ E REO RIP Cfimware). 15— 4 Ж Жш E, к ш 


J04 Mit 


TRE ROM PREP. —# ЖЖ {ЕН {ЕРДЕ ШТ РШЕ ЖЕЕ Л.Ж н ва BI, РС 的 
BIOS (ЖЖ ABESSE) RE. ИЛ. BUE WESTEZEM. ШКА Ж ЕН А 
CPU 的 O (ЖАЛЫН) 请求。 


iil TF fr 

TR eL RO SX, (bus) [rj der ИНЕДЕН DRAM + £r Bo se se [p] [B], ШЕК CPU НІ 
4r ug ez pik pl — nba. ХЕК Ж BUE $ (bus transaction). Ж 
F$ (read transaction) ЕРЕЖЕНІ CPU. Ж HR (write transaction). M, CPU 传送 数据 到 
F ff. 

Biki- ТЕТ SEE, ВЕЗАНЕ ЫЕ, ЕНЕНЕ. ЖАҒЫНЫН, HERBES Vu] 
Щу [и] Н 86. ШІНІҢ. ЫН, ҰҒЫ КЮЛЕ ЕЕЕ Ash. fb GE 
fis ЁГЕ Ж, ЖЕНШ ИЕТІН. Иш, НЕН ТКЕН ЕЛ 
НЕ ЖАИ ШЕШЕН АНЫН ШО 设备 ? ПТЕФЕШИЕНН? 总 强 上 的 信息 是 地 卉 还 
аЛ? 

图 五 6 展示 了 一 台 和 典型 的 卓 面 系统 的 站 构 ， 主 要 部 件 是 CPU SH. ЖІП UO 桥接 加 ПО 
bridge) 的 总 上 月 姐 【 其 让 包括 存 情 控制 由 1， 以 及 组 成 主 存 的 DRAM THREE, AER H 
BAHOEM EDEN. Kp 5 HE E ЖЕҢ (зучстїишв), FW CPU #H ШО EHE, 5 — «5 
REFREN (memory bus), EF VO HERE BEESERI E fF. 

VO HERH RAE Er) m S a ee EM eH FI LV. Fond REPERI. DO #НЕ& 
tue SE BEER PERIERE ДЕН VO БН, WERNEER О 设备 共享 VO Bb. ХИ 
Қа, Rpüp JI WH mm ЕЕЕ Е. 


CPU E. 






пава 


Bid RüEBSERCPUANETIESEN 
X E CPU 执行 一 个 加 载 操作 时 会 发 生 什 笃 


mov] А, *eax 

АН, ҢҢ ATA THER ТЕ tear Рр. CPU SH ER EHE (businteríace) 的 电 
И ñu К ЕКШ. ТЕЗДЕН РНН. B 36. CPU 将 地 址 a WARS |. DO 
ЗЕНА ЕЕ НЕА Е 8, EST (а). EFE ЕЙЖЕНІҒНШИАН ihhh, M 
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ХР EH RE. M DRAM RERET ЕД SE. ПСН ET 
oam F sk aski S. ЕБЕЗЙЕЯНАН, ЮЕ 67 (h), ЖБ, CPU Ж ЖЕ БЕТЕ 
B. АВ Puka. HARRENA Eea. ШІН 6.7 іс). 





(bo EFA RRE А, Fa. AAH: AREH E 


ЕХ 






(e) CPU А BRUIT x. НҒЕМИНЖІ теа 中 
Ró? ЛИНЕ mova ea Fri ЕЕ 
相反 地 ， 当 CPU 执行 一 个 存 情 操作 时 
mov] Xeax, А 


E, WffESeax HARRESA Hh А. CPU RUS E. БІН, АРШ. BL 
CPU ЯНЕ Л БВ ДЕЕ К. FIREM EREDAR ih. 3435391832, ШИ 68 (a). ET 
Ж, CPU тех ФО Re He LR LESER ER. ШЕ 68 (b), BE, Ef EG EH AEN RE. 
A m iix or ҒЫ DRAM P. ШІН 8 (c). 








[ | 
(a) CPU ЖШН A CH ERE HL. Edidi ThE, ЖМК 


ñ fr 8 k fl 


Ub» CPU HE KR у k B| hit Р 
LE mz 


ALU 


ti 
ги 
=} 
(e) XA BHRUEBUEY у. ЖЕНЕН А 


Hà fr movi Teor А MESES 


812 s] 

НЕГ МЕН ЕНХЕНЖІНҒЫН R. fri EHE ЕШ ОГ ЕЛ S LE T AGE 5. 
而 基于 RAM fria REB TLBRILTJET S. ЖЧ. Лия ЕТЕ Е ЛЕ, EA DRAM 
EET 078. IM SRAM i£ T 10077 £i. 

Ba Hu 

BEES (pate) AEN. ЕТС IPIE. Ki surface) Ж ШОНЕН. ЩН 
PARNE dh (spindle), Ez BH DL IS s ied Ж (rotatiomnl rate? 旋转 ， 通 党 
Kb 5400-15 000RPM (revolution per minute, HAt BSEC IU ÑE ik], 
НЕ ЕВЕ Н. 

ЕН 69 (a) к — F B 59088 SEE EI. EET ed d FERE Orak 的 同心 贺 
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HRR. HfpT RUIN UIS 3 SE (sector), ig (o НЕМЕНІ CREE ID Y 
H), АЕ И С р FISH. BOE f] d i ж (gap) HAF. АА 
ШЕШІ. [ОШ {СЕН ЖЕКШЕ EC EH zd 

RESMEN ИИ. VIA — HEB ER, mias (b) Ж 
T. “КЕЛЕК НЕДА EE (disk drive), i Ax ELDER EE (disk), 


айг us 


> Y 


X / 


ur 


la) ОТИ (b) £T ËH EW] 


H59 ШЕНЕ 

ШЕГИ BER Н ЖАНЫН (cylinder) ЗЕЕ $ OF ЕЛЕНЕ, ТАШ. ИШЕ ДЕН 
ий F (pas ЕНІНЕН. Dun, WR T9838 4A. fn dg. SET 
ЕЙ AR EE А, LA AER Е АА BOH КИК =. 

a a ut 

PES оО ЕНЕНЕ АЕ, ЕЖЕ +. uo RENI HEEL FS 
XD st dug t. 

* EREE (recording density) 【位 /英寸 )， 础 道 一 英寸 的 风 中 可 以 帮 入 的 位 数 。 

° WEI (track density) GASET); Mug Hep Eg X S ТЕЛИ. 

+ (ШЕЛІ Lareal density) UFAR: gae Ss al ipe nn oen 

eO t f WH S com p e {从 而 增加 容量 ) ПЕПЕ ЛЕ k sik. BN 
8. ЖЕШИНЕ FC РАО, ЖАРЧА ЗИ Н HIRE] E АЖ ЕНЕ db d N frg iR 
CREAREA EI. a T ip RU E t ИШЕ, ШТК MES EE НЕ. ei n d 
ЯШКИН, ЖЕЛІНЕ. ЖЫ. МАШИН. NIC ШШ ( ЖА dent ЕЕ 
RO SERORIIBURCYTA T. Db, ВЕСНА Е DERI EC B R iz (multiple zone recording) 
Ж. EXXBRMOK D. ШИШЕЛЕ ЕТ ЖШТ 六 集合 ， 称 为 记录 区 (recoding zone). АБК 
包 请 一 组 连续 的 磁道 。 一 个 区 中 的 每 个 碰 道 都 有 相同 数量 的 斋 区 ， 这 个 局 区 的 数量 是 由 该 区 中 最 里 面 
PER А H kl. ЕЙ, Momm P R GE. hi BEER CE ERG. 

КЧ АФ ШО Г А ЗЕ, 


Disk Mower average sectors #rracks W'aurfücer Й platers 
capacity 7 jer" іне“ raface  plamer 5” disk | 
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Иш. WI MER. H 5 ТИК, BiTHMICSIS T T. SASS] 20000 ИШ. ЕНІН 
ЇЇ FE 300 MIS. ЖАТТАЙТ Ж. 


Disk ЗІ2імез 300sectors, 20000rracks 2surfaces $ platters 


capaciy “ menor ^" mack ”有 plater ^— dak 
= 3 720000 00 bytes 
= 372GB 
ЕН. МЕҢЕНҒАЗІ (GB) tb Е НІН. Wi 1GB = 10 Т, 


Wi: —hTY9hEXx! 

Tik, É K (kilo) . M (mega) # G (giga) Ж#Н HE LOCA TET EL sF+T5 DRAM 和 和 
SRAM FHK AF K-2U, Mz 27, $0229, RET S UR de Нн DO ide Tin 
ЎН, AF K-i10. М=10, @ G=. йЭФЖвбертЖе лайн, 

жай, TRA HH E. ( hack-of-the-envelope ) ЕНІ. Ж EH LEX FE dT 
НЕН. dide, 27-1048 576 de 10° = 1 000 000 £ I] dtr k (25- 105/1062 $9. RR. М 
+ 2" 1073 741 824 Ж 10" = 1 000 000 000; (2 - ру 10 75, 





ЖУ 6.2 

НДН ЛБА, UN 2 Ah, 00x ER, ЕЛЕР 00 FE, S4 
^E SIFY, 

Bau" 

ШИНЕ HERI TREAT Cactuator arm) IHE LE Ж Cread/write head) XXE ИЕШЕ RIN 
Wir. ШІН 610 Ca) Bras. ЖИА НН eS. ЖИГИ ЯС up fS Ш E 
MERGE Pp. АНШЫ iñ (Gee. — НИН НӘН ТШШ ШЫ L. X5 i 
iB dT Ж LIES КИІН, iEn ЖГ ПИП iri E Cub ii, Шиш ДҮН 
Cub. 3T Heg t en a EA Teri XL. ШИ 610 (h) Bras. У 
Xs HERI. гар. ЕНЕ, MAREFA AE, 







Бе Ет | - 
ia uU Kg Mt Rami 
A ku. crassa Е к, 


ШИИТ ЕЕ 


U/ 国 过 在 让 村 方向 上 
ай. ШЕГІ 
"nib x {А 
тиш! 

a) —+ HERE (o ET EHI 


Нало 磁盘 的 动态 特性 
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ТЕЛЕҢ ЖОП PESE {ЕЕ ЕА ХЕ 01 OK SS В А 1 Й. ЖУА?) 
BOkm/h. (1 КУ АВ 81, ЖШ FB CER RR REE. WRES CES] ТОХТАР. 
1, WS AUR. MHA MRR5 Acti (headerad АЖ, АРРАН, 

iE RE ELSE CAU EHE EE ORE SEC РУН 0) (access time) 8 — T =: TÉ 

时 间 (seek time), ЖЕЕ] Crotational latency? ЖИЕНІН (transfer time): 

• 寻 首 时间， 为 了 读 取 某 个 目标 扇 区 的 内 容 ， 传 动 璧 首先 将 读 / 写 头 定 位 到 包含 目标 电 区 的 磁 

道上 。 移 动 传动 辟 所 项 的 对 间 称 为 寻 道 时 间 。 寻 道 时 间 Т, 依赖 于 传动 臂 以 前 的 位 置 和 传 
zB iS LEES. MARSA К) AE [8] Tu, ;on 是 通过 对 几 王 次 对 随机 局 区 
的 寻 道 求 平 均值 来 测量 的 ， 通 常 为 6~9ms。 一 次 寻 道 的 最 大 时 间 Т, дзее 可 以 高 这 2005. 

。 旋转 时 间 ， 一 互 读 / 写 头 定位 到 了 期 望 的 磁道 ， 驱 动 器 等 待 日 标 扇 区 的 第 一 个 位 旋转 到 读 / 

GAT. 这 个 步骤 的 性 能 依 束 丁当 读 / 写 头 到 达 有 目标 遍 区 时 盘面 的 位 置 , 和 位 盘 的 旋转 速度。 
在 最 坏 的 情况 下 ， 读 / 写 头 刚刚 错过 了 日 标 扇 区 ， 必 须 等 待 磁盘 转 ИН. В, в Ке 
时 间 ， 以 秘 为 单位 ， 是 

_1 Өме 

RPM imin 
平均 旋转 时 间 Tu, лашын 是 Tmar rotation 的 一 半 。 

. 传送 时 间 :， 当 目标 届 区 的 第 一 个 位 位 于 读 / 写 头 下 时 ， 更 动 器 就 可 以 开始 读 或 者 号 该 房 区 的 
内 容 了 。-- 个 肩 区 的 传送 时 间 依 赖 于 旋转 速度 和 每 条 磁道 的 扇 区 数 日 。 因 此 ， 我 们 可 以 粗 
略 地 估计 一 个 房 区 以 秘 为 单位 的 平均 传送 时 间 如 下 

lox i 60 secs 

RPM — (average sectors/track) тіп 
RAIT EL frc — TW БИК Pq РАУ А) UE B IRE TRO. SP P ЕЕ Ja] RUE У 

ІНДЕ. Piin, 0 W F2 РШ: 


T max rotate 一 


T 


ауа тапк 一 





旋转 速率 


Tag irek 9ms 
ЖОН ETE Ra [I Ж 400 





对 于 这 个 三 盘 ， 平 均 旋 转 时 间 (以 ms 为 单位 ) 是 


T uo rotation = EXT max rotation 


= ]/2x(60secs/7200 RPM )x 1000 ms/sec 
zooms 


SF EHE N lB] Ж 
Татту 700/7200 RPM x1/400 sectors/track x 1000 ms/sec 
= 0.02 ms 
Bon. Seir UI RHET [8] Ж 
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lcm = laa + lang roin + Тад transfer 
= ту 4 «0.7 mr 


= 13.02 тт 


这 个 岗子 谋 明 了 一 些 祖 重要 的 问题 ， 

* Ur THESE CP. 512 字 节 的 时 间 主 要 是 导 道 时 间 寻 旋转 时 间 。 访 问 而 区 中 的 第 一 个 部 
闻 用 十 祖 长 时 间 ， 租 是 各 下 的 字 节 几 笠 不 用 时 间 ， 

4 因为 寻 道 时 间 和 禾 转 时间 夫 政 相等 的 ， 所 以 将 导 甬 时 间 更 > 是 估计 碰 盘 访问 时 间 的 简单 面 
合理 的 方法 ， 

. ЖҮГҮ SRAM ТАЕ BT UL ИЕН КЕНЕ dns. 对 DRAM 的 访问 时 间 是 біне. Ee, M 
AES SEDE 引 12 字 节 肩 区 友 小 的 抉 的 时 间 对 SRAM ЖІ c] E 25608, 对 DRAM ЖІ 
ЖЕНЕ 4000ns， 梯 盘 访 问 时 间 (大 的 DOms? 比 SRAM APA 40000 倍 ， 比 DRAM X EI 
2500 信 。 如 时 我 们 出 较 访 问 一 个 单字 的 时 间 ， 计 些 访 问 时 间 的 整 别 全 更 去 ， 

Ë 5]H 6.3 

ЖИ РГЕ R 4-343 FE А i [ИНИ] CO ms 3 di yk 


kh Ls 19 О00ЕРМ 


T sei LI EU Ds. tr 


Bü 8 H 

Ful ЭП. MARRARA HEt tA. Wika ЕНІНЕН ЕК. WT G 
HiESIEBNUELH MM PE, СВЕ ЕРЕ TIR MIRI fL (Dg F bI E AG АЈ, HR 
VJ Дені. MEET T REAREA. Roa ER MB. ЧЕ ЕШШ UO AER OW 
B) gx P RI EE. 

SAFRE T—^- VO ЖИЕН, Wit- Ha ESI ECDECE E TE. RES NI — 
КЕЗЕН. LEETE, Eros ERTIN FEHLT PR ik. d TENER 
vM GEB, їй. Юй) HST. uet Sum Ui T xpo RUHK. Fn 
LT SEIT sc. W LDO АННА Ui EN. ЖИЫН DO 头 下 ， 将 DO МН 
Iit (erit ЕШ Е-Е, Med E ME, 

ЯН. WWG EN j 

RR ECT ЩЩ Y, ES MEAE HER ER AUG. а blen йы h E bi АП IE 
WA. ЖЕШ АГК н Н Ee moR, JAAR E EE-E N. PERS 
—r dd As кинин Т. waka RE HS, ЯДА ФЦ ndi. Mona 
-EE ges DEUE S dA то A 


над 
НЕКЕНІ. Кі D EROR ІТ MR 38 E НШІ Іше! 的 PCI Peripheral Component 







5 8E B ЕК н 401 
Inerconnect, 97484-54) 总 线 这 样 的 VO 总线 连接 到 CPU 和 主 看 的。 同系 缠 总 线 和 存 刷 器 总 线 
THRICETIA 5 CPU HZA), itn PETAR EYRI ОҢ REMIS RICE CPU e M n PC AI Macintosh 


者 可 以 使 用 PCI ER. Шеп 展示 1 一 个 典型 的 WO ERES СЫ PCI 为 模型 )， 它 连接 了 CPU. 
EFA LVO de. 


CPU 


қыйын 


311 





ГІП ІТ 
3 siue dci 















| USB лін | | кш 


км Ей ERN 


Héll “нн. ЕЕ СРИ. ео 设备 
虽然 UO ВЕЕ АА T ЕЕН, їн ҮА ЖЕШ у у DE. WR. 
EMAN 中 ， 有 三 个 不 同类 型 的 设备 连接 到 总 线 ， 
* USB (Universal Serial Bus. 484 囊 行 总 线 ) Foil t — с ik HERI USB НІН. USB 
的 香 吐 率 可 以 达到 D02Mbivs, ES HH BRE. Bing. NOx. HOA 
HO. НЕНИ. ШАН, CD-ROM Wis ИТЕП. 
° 图 形 卡 《或 适配器 ) CAERE., СЕНА БР CPU Ета ЕШ Ж. 
* BUE BU ИНТЕК. HIH OCR CPU Еа. 
此 他 的 设备 , шик, "АЖЕК А, P| iS IPSE RA p, ДЕЕ DO 
БЇ. ШЕНЕ Т RUD EE PT IER ERE. 
BS TERRE Li0 W k R hiii T f CLE n p HESS RR dir Rune. p 
BAT IB k NOE dE. Bin. IB 6.12 总 站 了 当 CPU WB ub e e n REN. 
CPU fH] — Fs h Aku h TO (memory-mapped VO) 的 技术 来 向 TD de ded dr, mp 
512 (a? Br, ЕЕ ШҮК VO 的 系统 中 ， 地 址 空间 中 有 一 执 地 址 是 为 与 vo ЖШПЕН 
BJ. 每 个 这 样 的 地 址 称 为 一 个 UD SU. (UO роп). КАНН В, а 
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MERE CERE ERREUR BI T ТЧ О), 
CPU &А 


is 





(а) CPU rir. FENRERHETHREIBRIERM RE КЕШНИ КЕНЕ АВЕ, EE Tus 
CPU # 





| 
m | xg 
т 
vo gd 
国 
КТҮҮ шағын 





zn E 


(bo ШЖ ЕМШИ. НЧА ЕЕЕ DMA fes 
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CPU ЕЖ 








ic? $ ОМА REAN BARMAN- b I EAT CPU 
Ж 5.12 ik—T ERE 

作为 一 个 简单 的 例子 , ЧЕ ШК ШШШ НАН ET Ока. МБ, CPU 可 能 通过 执行 三 相对 地 
址 Oxa БАРЫН», KEWQU W $i $ RS Hrsg. КЕЛШІ TE. HURI 
ГЕННЕН, (ИШ ЁН, ЖЕТ ЕТ CPU CRIT 81 РЕНЕ О, ЖЕНЕ 
ЖЕНЕ. Ж = {И 058089 E UAE I EXC ЯЛЕ FEMA. 

^4 CPU 发 起 了 请 求 之 后 ， 在 磁 鼻 执行 读 的 时 候 ， 它 通常 会 屠 些 其 他 的 工作 。 回 想 一 下 ， 一 个 
IGHz 的 处 理 器 时 钟 周期 为 Ins， 在 用 来 读 左 盘 的 16ms 时 间 里 ， 它 潜在 地 可 能 执行 1600 НЕ. 
在 性 输 进行 时 ， 只 是 前 单 地 等 待 ， 什 笃 都 不 数 ， 是 一 种 极 大 的 浪费 。 

在 磁盘 控制 器 收 到 来 自 CPU 的 该 而 信之 后 , 它 将 运 辑 埃 导 翻译 成 一 个 扇 区 闻 址 ,该 该 贞 区 的 内 
容 ， 烧 后 将 这 些 内 容 直 接 传 送 天主 存 ， 不 需要 CPU 的 干涉 ， 如 到 12 (b) 所 东 。 这 个 设备 可 以 自己 
ATERT SARRA. maj СРО Ж ЕЕ. ЖУ DMA direct memory access. ЖА 
Sirm. NEM [CU EO DMA Wik СОМА transfer), 

在 DMA ЕО, BESENI« PA Te MC T EM ЕО, ЕНЕТІНІ CPU НҚ 
h ЕН ki CPU, ШІН 6.12 (с) 所 示 。 基 本 思想 是 中 断 会 发 信号 到 CPU 芯片 的 一 个 外 部 
ЕНШІ, B1298 CPU 暂 迟 它 当 前 正在 做 的 工作 ， 眩 转 到 一 个 的 作 系 线 函 效 ， 这 赴 函 败 佐 记录 下 
UO pP. Жайкыныаы CPU ЖЕШ. 





404 | жө 


қыл, АПТАЯНЫҢ 6.13 f idee iE А. 


A ETE 
Hina 





Ш 6.13 ІВМ Ultrastar 3éL7X 的 构造 和 性 能 
Wd. ww stonge ibmcom. 


жй йр. EO ERE MEHR, Til. SAC А АЖ Т = 
If rR. 种田 DiXImc, G Ë 0 3 8k TX SCSI A d do RE АА 164), 494, DIXtmc 
ERMAN HH IBM АА 6, eB 14 RES. &# 4—44 T b k ü И 小 区 中 
МЕ, KT TAKE. 映射 到 请 区 TAEHSHRAER, АИКА, 


1291096 

22929097 | 11949 75] 
| 11949752 | [0416 566 
| 19416567 | 36 409 689 
39 844 151 

52 | 46 287003 

5i 201 E29 

56 091 915 

b | 60087 E] 

67 001 919 

71 687 339 


Ш 68.14 IBM Ultrastar 3áL7X 的 区 图 
XB. DiXmac [1:58 8 ЖАНЕ Т. Мува]. 


REBARi—PEXT—EXTIBMBÉ&HdEHT E, dh. КАЕ (ЖЕРЕ) 比 
але тт Ш, S&HUdSIEITMBAR RE НД (га Велф т), 来 被 性 用 
ПАВЕ АНЕ, &X—HAEEMNILRHAEGRT, MARHA iait 
к ТЕНГИНЕ E. Wa, ANTA. HERRERA TLLA EDU Е 
ЭИ} Но, ARERR- EAE, P aiit Pari, IATER 10 o AERA 
инке н, СР ТЕТ ЕТУ ЕЧ 
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6.13 存储 技术 趋势 

从 我 们 对 存储 技术 的 讨论 中 ， 可 以 总 结 刘 玫 个 很 重要 的 思想 ， 

. 不 同 的 存储 技术 有 不 同 的 价格 和 性 能 折 中 。3SRAM E DRAM 快 一 点 ， 而 DRAM ШИЙ Ж 
EEZ. -Fi REFR a ЕЕ ДЕЗЕ RN. SRAM 每 字 节 的 造价 比 DRAM 高 ， 
DRAM Mit ERRA E. 

КААК R AE ЖЕ ДЕЕ ik dE 615 总 结 了 从 1980 年 以 来 的 
TERREI ARER. 最早 的 PC 是 那 一 年 提出 的 , 这 些 数字 是 从 以 前 的 贸易 杂志 中 
挑选 出 来 的 。 黑 然 它 们 是 从 非 正式 的 调 但 中 得 到 的 ， 但 是 这 些 数 字 还 是 能 揭 沙 出 ~: 些 有 趣 
的 趋势 的 。 

BA 1980 年 以 来 ，SRAM 技术 的 成 本 和 性 能 基本 上 是 以 相同 的 速度 改善 的 。 访 问 时 
间 下 降 [AS 100 fi. 而 每 兆 字 节 的 成 本 下 降 了 200 倍 , 如 图 6.15 (а) Aia Л, DRAM 
和 磁极 的 变化 更 大 ， 而 且 不 一 臻 。DRAM 每 兆 字 节 的 成 本 下 降 了 8000 倍 所 小 几乎 是 四 个 
AEA), m DRAM 的 访问 时 间 只 下 隆 了 大 约 6 倍 ， 如 图 615 (b) 所 示 。， 磁 盘 技 术 有 和 
DRAM 上 由 同 的 趋势 ， 甚 至 于 变化 更 大 。 从 1980 年 以 来 ， 磁 挫 存 储 的 每 兆 字 节 成 本 增长 了 
50 000 倍 ， 访 问 果 间 虑 善 得 很 少 ， 只 有 DAAN., ШЕ 6.15 (с) 所 示 。 这 些 惊人 的 长 期 
趋势 突出 了 人 存储 器 和 磁盘 技术 的 一 个 基本 事实 ; 增加 密度 〔 从 而 降低 成 本 ) 比 降低 访问 时 
间 更 容易 。 

° DRAM 和 磁盘 访问 时 间 滞 后 于 CPU 时 钟 周 期 时 间 。 正如 我 们 在 图 6.15 (а) 中 看 到 的 那样 ， 
从 1980 年 到 2000 年 , CPU 时 钟 周期 提高 了 600 ff. HLF CPU 性 能 ，SRAM 的 性 能 是 稍 
Xm JE SRAM 的 性 能 在 保持 增长 。 然 而 ，DRAM 和 磁盘 性 能 与 CPU 性 能 之 间 的 差距 
实际 上 是 加 大 许多 。 图 6.16 清楚 地 和 表面 了 各 种 趋势 ， 以 半 对 数 为 标 度 (semi-log scale). ifi 
出 了 图 6.15 中 的 访 河 时 间 和 时 钟 周期 。 





















100 30 1 8 000 

访问 时 间 (ns) 475 200 HO Т0 60 Š 

典型 的 大 小 CMB) . 2 4 16 64 1 000 
tb) DRAM £32 

1985 | 190 | 195 | 2x0 [| 20001980 





访问 时 间 (ms) 
典型 的 大 小 (MB) 


100 8 0.30 0.01 50 000 
87 75 28 10 8 11 
1 000 20 000 20 000 


(c) mme 
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[mem — | s | we | s | m [m 
тесу [ию юж | waw [мш | киш | 
600 


8 ОКО 
CPU В (MHz) 6 20 
CPU Н ЯҢ Спе) 166 50 
图 215 存储 和 处 理 器 技术 发 展 趋势 


(d) CPU Ë$ 
100,000,000 pM -- 
10,000,000 Macc 
1,000,000 
100,000 
Ë 10,000 
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图 616 DRAM, WAA CPU 速度 之 间 逐 海 增 大 的 差距 


正则 我 们 将 人 在 6.4 节 中 看 到 的 浪 样 ， 现 代 计 算 机 频繁 地 使 用 基于 SRAM бт т, DUREE 
理 硕 - 行 入 器 之 间 的 差距 。 这 种 方法 行 之 有 效 是 因为 应 用 程序 的 一 个 称 为 局 部 性 《locality) 的 基本 
属性 ， 接 下 来 我 们 就 讨论 这 个 问题 ，。 


6.2 局 部 性 


一 个 编写 恨 好 的 计算 机 程序 候 疝 于 展示 出 良好 的 局 部 性 【ioeality )。 也 就 是 ,它们 倾向 于 引用 
的 数据 项 邻近 于 其 他 最 近 引 用 过 的 数据 项 ， 或 者 邻近 于 最 近 白 我 引用 过 的 数据 项 。 这 种 倾向 性 ， 
刷 称 为 局 部 性 原理 〔principle of locality)， 是 一 个 持久 的 概念 ， 对 硬件 和 软件 系统 的 设计 都 有 着 极 
大 的 影响 。 

局 部 性 通常 有 岗 种 形式 ， 时 间 局 部 性 (temporal locality) 和 空间 局 部 性 《spatial locality)。 在 一 
个 具有 民 好 时 间 局 部 性 的 程序 中 ， 被 引用 过 一 次 的 存 赃 器 位 置 很 可 能 在 不 远 的 将 来 肯 被 多 次 引用 。 
仁 一 个 具有 良好 补 间 局 部 性 的 程序 下， 如 巢 一 个 存储 器 位 置 被 引用 了 -~ 次 ， 那 么 程序 很 可 能 在 不 远 
KERS БАЙ МЫн. 

FAAARA MARTRE, NOSTER. Ж REA ERST OE AE 00 48 Дык 049 
ER. ВИТЯ АЙТА ER. MENIREA, НЕР, ӨПЮВИЯЯНТАН 
性 。 CEHE. HARRER ИТ АПТА И ub НЫН T POE IS Fe DR 
来 保存 最 近 被 引用 的 指令 和 数据 项 ， 从 而 提高 对 主 存 的 访问 速度 。 在 操作 系统 级 ， 局 部 性 原理 允 
许 系统 使 用 主 存 作为 趾 拟 地 址 空间 最 近 被 引用 抉 的 高 速 缓 存 。 类 似 地 ， 操 作 系统 用 主 存 来 淄 存 磁 
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BOCA ЖӨ OE ШЙ Н ТАН. АЕ E py BERUF IB yr rh ib py ЖОЕ J ЯВ. PLN, 
Web 3 28 PS ro НІК phi ЖАШ Е, ШЙ ЖН Н) БИ. X BD) Web 服务 器 将 
EC UL MY Va Ж ACTS RA tE BU S RS Ж Рр. ХЕ fr jo Wa e АПШ CR ТАК, її PR 
器 的 任何 上 涉 ， 


6.2.41 对 程序 数据 引用 的 局 部 性 

考虑 图 6.17 (а) 中 的 简单 竟 数 ， 它 对 一 个 向 量 的 所 有 元 素 求 和 。 这 个 程序 有 良好 的 局 部 性 吗 ? 
为 了 回答 这 个 问题 ， 我 们 来 看 看 每 个 变量 的 引用 异 式 。 在 这 个 例 了 中 ， 变 量 sum (ЯНА S Vil: 
概 引 用 一 次 ， 因 此 ， 对 于 sum 来 说 ， 有 好 的 局 部 性 。 另 - 方面， 国 为 sum 是 标量 ， 对 于 sum 来 说 ， 
没有 空间 局 部 性 。 

正如 我 们 在 图 6.17 (b) 中 看 到 的 ， 回 量 v 的 元 素 尾 被 顺序 读 取 的 ， 一 个 接 一 个 ， 按 照 它们 存 
情 在 存储 器 中 的 顺序 〈 为 了 方 重 ， 我 们 很 设 数组 是 从 地址 加 开始 的 )。 因 此 ， 对 于 变量 v， 函 数 有 很 
好 的 空间 局 部 性 ， 但 是 时 间 局 部 性 很 差 ， 因 为 每 个 同 量 元 素 只 被 访问 一 次 。 因 为 对 于 箱 环 体 中 的 每 
个 变量 ， 这 个 函数 要 么 有 好 的 空间 局 部 性 ， 嘉 么 有 好 的 时 间 局 部 性 ， 所 以 我 们 可 以 断定 sumvec M 
数 有 良好 的 局 部 性 。 


int sumveciint v[N]) 
{ 


int i, sum = Ü; 


tor {і = Ü; 1 < N: i++) 
Sum += vl[il; 
return sum; 


Сп - CFR LA 4m L2 EB ғұ 





(h) 


ЕН 6.17 (а) 一 个 具有 良好 局 部 性 的 程序 ，(b) 向 量 v 的 引用 模式 (М=8) 
注意 如 何 按 照 问 量 元 素 存 情 在 存储 器 中 的 顺序 来 访问 它们 。 


我 们 说 像 sumvec ХАЖЫ “个 向 量 每 个 元 素 的 函数 ， 具 有 步 长 为 | 的 引用 模式 (stride-1 
reference pattern) “相对 于 元 素 的 大 小 )。 仿 问 一 个 连续 的 同 量 的 每 第 k 个 元 素 ， 就 被 称 为 步 长 为 
的 引用 模式 Cstride-k reference pattern)。 步 长 为 1 的 引用 模式 是 程序 中 空 敬 局 部 性 常见 和 重要 的 来 
源 。 一 般 而 言 ， 随 着 步 长 的 增加 ， 空 间 局 部 性 下 降 。 

灶 于 引用 多 维 数组 的 程序 来 说 ， 步 长 也 是 一 个 很 重要 的 问题 。 考 虑 图 618 (а) PHRA 
sumamayrows: ER 一 个 二 维 数 组 的 元 素 求 和 。 双 重 循环 按照 行 优先 顺序 (row-major огдег) 读数 组 
的 元 素 。 也 就 是 ， 内 层 循环 读 第 一 行 的 元 素 ， 依 此 类 推 。 函数 sumarrayrows 具有 良好 的 空间 局 部 性 ， 
国 为 它 按照 数组 被 存储 的 行 优先 顺序 来 访问 这 个 数组 ， 如 图 618 (b) 所 示 。 其 结果 是 得 到 一 个 很 
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好 的 步 长 为 上 的 引用 模 扩 和 县 好 的 空间 局 部 性 ， 


1 int sumarrayrowsiint а[У][М]) 
2 { 

3 int i, 1, sum = 2; 

4 

5 for {i = 0; i < M; 1++) 

6 for (| = 0; J < N; j++) 
7 sum += а[1][7]; 

8 return sum; 

9 } 


ta) 


4 Ë 12 16 20 
mL p Eo dE d С 
ib) 


618 (а) 另 一 个 具有 良好 局 部 性 的 程序 ; 数组 9 的 引用 模式 (M= 2, N=3) 
h RU Уа Е, ЕяэкнЕнт E e ib d ERR snot et ER aus. 


-EE | A dg ^ EDS] PEPPER RE RES 0 НЕА RARE. НІШ, Е 6.19 Са) PERR 
sumarraycols И 算 和 图 6.18 (а) АЖ sumarrayrows 一 样 的 结果 。 ME ПУЛА iM) 
的 循环 ， 这 样 变 换 逢 环 对 已 的 局 部 性 有 何 影 惠 ? 

ЖЕЕ [ар КЕШНДЕ Ji Ж sumarrayeols， 因 为 它 按照 别 来 扫 朱 数组 ， 而 不 是 护照 行 。 内 为 
数组 在 存储 器 中 是 按照 行 来 存放 的 ， 结 果 就 得 到 步 长 为 (N X sizeoffinb) 的 引用 模式 ， 如 图 6.19 (b) 
ЕЛ s 









int sumarraycols(int a[M][N]! 
i 


int 1, ], sum = 0; 


for (j = 0: j < N; j-+) 
for {1 = 0; 1« М; i++} 
sum += a[i]lj]; 
return sum; 


мт ПО —l «Т Л i м BR 一 


= 





me popolo qe 


(b 


Е 5.19 (а) 一 个 空间 局 部 性 很 差 的 程序 ; (b) 数组 c 的 引用 模式 (M= 2, N = 9) 
函数 的 空间 局 部 性 很 疼 ， 这 足 因 为 它 使 用 步 长 以 (N X sizeoffinb) 的 引用 模式 来 扫 措 存 情 器 。 


ЕАН 409 
аана анала РАННИ. 
622 取 指 令 的 局 部 性 

固 为 程序 指 专 是 存放 在 存 情 器 中 的 ，CPU ДІҢ (Н) ШЕН A. ЖИЙДЕ ГЕ ДЕІН 
一 个 程序 基于 取 指 地 的 局 部 性 。 例 如 ， 图 &17 中 for ҒАН КИЛЕ y ЖЕЕП НЕШ Z h SE E 
ІІІ, НЕЕ Ен НТ. DID EE D De a LET E OL REEL iot RI t f] ID T. 

代码 区 别 于 程序 数据 的 一 个 重要 属性 是 在 运行 时 它 是 不 能 被 收 改 的 。 当 程序 正在 执行 时 ，CpU 
只 从 存 赃 器 中 读 出 它 的 指 亏 。CPU ATARI ШИЕ АПАНЫН. 
623 局 部 性 小 结 

任 这 一 节 中 ， 我 们 他 绍 了 局 部 性 的 基本 思想 ， 还 给 出 了 一 些 量化 评价 一 个 程序 中 局 睫 性 的 简单 
ҮТ 

. 重复 引用 同一 个 变量 的 程序 有 良好 的 时 间 局 郁 性 ， 

* 对 于 其 有 步 长 为 的 引用 模式 的 程序 ， 步 长 越 小 ， 空 间 局 部 性 越 好 。 具 有 此 长 为 | 的 引 

ШЇ ПИК ЕТГЕН ЕНІНЕН. TTAR СЕРЕ ЕВЕ E ВРО РЕ У а НЕ 


ШЕЛ 
* ОРАЙ ЖОН, ИНТЕРН. ЖЕШЕТ. Е А Е, НЫШ 
тын. 


到 本 章 后 面 ， 在 我 们 学 习 了 高 速 缓存 存储 器 以 及 它们 是 如 何 工 作 的 之 后 ， 我 们 全 向 你 展示 如 何 
Шш йр EN р Ro NER RIEISRER. Rupe Sn dre eR 
КЕШЕДЕ ЕТТЕ. ш. ТИШИП АН ИЕ DEA RE ЕЛЕ БИНЕ HER 
BE RETSESmES— UU RI R ü Gb. 


М) 6.4 
B.T R h ФИНА, RZ LPK Ob 15 Ü BA id = HC а, 
| int sunarrayi3d(int a[N][H] [H]] 
2 | 
int i, j, k, sum = 0; 


1 

d 

5 tor (i = Ü; і < Hr i++) Í 

Б for (j = 0r j < N; j++) { 

7 tar [k = Ú; k « N; ke«) | 
H Bum += a[k] [1] [3]: 

j 


: | 

10 ] 

11 1 

12 return Bum; 

13 } 

ЕМ 6.5 | 


H 620 P$) А, к RB ER B ACCRUE, during ede, ahi b gu ie Dan 
EHHE, Wi Анн ДЫ SE, 
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1 void clearlípoint *p, int n) 

2 1 

3 int i, j; 
| — &define N 1000 1 
р 5 for [i = O; 1 < n; itr} d 
3 typedef struct 1 6 for (j = 0; J < 3; je 
4 int vel[3]; 7 pli).velli) = 0; 
3 int azc[3]; 8 tor J = O; J < 3: J++) 
5  ) point; 3 p[il.acc[j] = 0; 
7 10 } 
8 point рім]; ll ] 

(a) structs 数组 ( b) ceal ЕЖ 
. . ñ | 

1 void clear? (point *p, int n) 1 уота clear3 (point Яр, int n) 

2 Í 
2 4 | | | 
3 int 1,3; 3 int i, j; 
4 Д 
5 for (iz Ü; i < n: i++) f for 2 ur 7 3 j++) Í | 
б for [) = Ü; J < 3: J++) [Í И от r = " ü n А 
7 pfil.vel[j] = 0; plij.vell3] = 0; 

. . В tor {1 = Ü; 1« n: 1-4) 
8 p[ijl.acc[j] = 0; . . 
9 ) 3 р[1].асс[1] = 0; 
10 ) 10 } 
11 } 1 1 | | 
(c) дедо 函数 4) elear3 ШЖ 


4,620 Ж 6.5 的 代码 示例 


6.3 ”存储 器 层次 结构 


6.1 1010.2 六 拉 述 了 存储 技术 和 计算 机 软件 的 一 些 基本 的 和 持久 的 属性 ; 
. 不 同和 枉 情 设备 的 访问 时 间 差 异 很 大 。 速度 较 快 的 设备 每 字 节 的 成 本 归 比 速度 钱 慢 的 设备 疝 ， 
ПНЕ, СРО 和 主 存 之 间 的 速度 差距 在 增 大 。 

. 一 个 编写 展 寻 的 程序 修 问 于 展示 出 良好 的 局 部 几 。 

计算 技术 中 一 个 喜人 的 巧 含 是， 硬件 和 软件 的 这 些 基本 属性 互相 补充 得 很 完美 ， 它 们 这 种 相 于 
补充 的 性 质 使 人 想到 一 种 组 织 存储 器 系统 的 方法 ， 称 为 存储 器 屋 次 结构 《mermaory hierarchy), ВТ 
的 现代 计算 机 系统 中 部 使 用 了 这 种 方法 ， 图 6.21 展 沙 了 一 个 典型 的 存 情 器 层次 结构 ， 

eu. MARTREZE RARE SES. POCHE X. FEE (LO)， 是 少量 的 
快速 CPU 寄存 器, CPU 可 以 在 一 个 时 钟 周 期 内 访问 它们 。 接 下 来 是 -一 个 或 多 个 小 者 成 中 型 的 基于 
SRAM 的 疝 速 缓存 他 储 器 ， 可 以 在 几 个 CPU 时 钟 周 期 内 访 避 它们。 然后 是 一 个 大 的 基于 DRAM 
的 证 咎 ， 可 以 在 几 十 或 几 百 个 时 钟 周期 内 访问 它们 。 接 上 来 是 慢 速 但 是 穿 量 很 大 的 本 地 磁盘 ， 最 
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m. Him ERII-—IERMIBnFIANTSS LES. Vx rU. Pin, dr 
APLR (АҒ) 或 者 网 阁 文 忻 系统 NFS) IE HUE ЕН. ТРОЕ UI fap ЖЕНЕ 
ШЕЙИН Ий КЮЕ. Жын. HW ЛИНДЕ А IE RETE T YE EGERIT IE) Web 服务 器 
fige ft. 
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631 EFRR RA ЕТТЕ 

HMA. ЖЕНА (cache, ШИЕ “саһ”) 是 一 个 小 而 快速 的 存储 设备 ， 它 作为 存储 在 更 大 ， 
ЕНШІИН ТРРНЕНФИЯУМЫАН BERE EHE Fr REFERO RE FE Caching. Е cashing). 

froh pm m. ға, ЕТЕНЕ Sfr hik PET kel Iz 
НЕ guise. hu. EREA EHG E k ИНЕ— mineurs. 
нш, Egi DE IE OU HEP UL ERE ЕШ Е Cm Web SEI HET., ЖЕ А ЖИЕ 
LEER. МЕХ, НА ИЙ СРО Wir yk, 

ІН 6.22 Ios T Ari ab КЕКЕК ӘЛЕ. ТЕН ЕНИГИЕНШӘНШЕНІШЕНДЕН 
ӘЛІН Cehunks), АЯ (Һюсін). fofi THE Mh E. DER IECIT Joh de. H 
MURATA p 5 Cam ЖАНЫН up EL npe cop irc m, E RETE МНЕ ЕЛЕК HTML 
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文件 ?， 例 如 ， 图 622 中 第 keel БЕНЗИН A 6 个 大 小 国定 的 块 ， m5% 0-15. 

жун, ЖКТ ЗЕ M.D KAQ hit, SPS AVR kel 层 的 块 的 大 小 一 样 。 
在 任何 时 刻 ， 第 kk 屋 的 缓存 包含 第 k+l 是 块 的 一 个 子 集 的 措 风 。 МШ, BL 6.22 +. ЖЕМІНЕ ғ 
1 4 个 块 的 空间 ， 当 前 包含 块 4、9、14 和 3 HRN., 

疾 推 总 是 以 块 太 小 为 情 送 单元 【transfer uni. 在 第 k 层 和 第 k+l HAERE ЙЧ. BAER 
次 结构 中 任何 一 对 开 邻 的 是 次 之 间 块 夫 小 是 固定 的 ， 但 是 其 他 的 层次 对 之 岂可 以 有 不 同 的 霹 人 小 。 
Мі, ÆR 6.21, LI 和 10 之 间 的 传送 通常 使 用 的 是 上 个 学 的 抉 。1L2 和 LI 之 间 CELER L3 RI L2 
21) 的 传送 通常 重用 物 是 4~-8 个 字 的 块 。 而 L4 和 L3 之 间 的 传送 用 的 是 太 小 为 几 百 盛 几 薄 字 站 
fik. В, 是 次 结构 中 较 低 层 СВ CPU Bo 的 设备 的 访问 时 间 较 长 ， 因 此 为 了 补偿 这 些 较 
长 的 访问 时 间 ， 倾 向 于 使 用 较 太 的 块 。 


--- ЖЕФ М, ЖІК, ЯН Ф 
# к: ген [a] AE kH ATE 


PEE A ТАТЕ 
m д ES a LL [RES Л 





Гот] 
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Ë [ RU ERU RUN 
181411161 





图 6.22 存储 器 层次 结构 中 一 个 基本 的 缓存 原理 


缓存 命中 

当 程序 第 要 第 k+l 层 的 基 个 数据 对 象 4 时， 它 首先 在 当前 在 储 在 第 K 层 的 “个 块 中 查找 d。 如 
R d 刚好 缓存 在 第 kK 层 中 ， 那 么 就 是 我 们 所 说 的 组 在 党 中 (cache hit)。 该 程序 直接 从 第 下 技 读 取出 
根据 存储 器 层次 结构 的 福 质 ， 这 要 比 从 第 kel 导读 到 4 更 快 。 例 如 ， 一 个 有 和 良好 时 间 局 部 性 的 程序 
ТАЛА 巾 旋 出 一 个 数据 对 象 ， 得 划一 个 对 第 K 层 的 组 仔 前 中 。 


缓存 不 命中 

另 一 方面 ， 如 果 第 k hT TUTARI d WARRE IREA TEP Cache miss), 
当 发 于 缓存 不 命中 时 ， 第 上 层 的 缓存 从 第 kel 层 缓存 中 取出 包含 d ЯА, ЯЯ К 尼 的 缓存 已 
ја ГН, ПНЕ с ЕТ) Ak 

Bu 个 现存 的 块 的 过 程 被 称 为 替换 《rcplacing) 或 驱逐 Cevicting) 这 个 块 。 补 驱逐 的 这 个 块 
有 了 时 也 被 称 为 特 牧 块 【victim block)。 决 定 该 蔡 换 哪个 快 是 出 缓存 的 蔡 换 策略 米 控 制 的 。 例如， 
个 具有 随机 替换 策略 的 缓存 会 随机 选择 一 个 幅 牲 块 。 一 个 具有 最 近 最 少 被 使 用 (ІІ) 转换 策略 的 
组 样 会 选择 那个 最 后 被 访问 的 时 间 虽 现在 最 远 的 块 。 

ЖК 后 缓存 从 第 kH 层 取出 那个 块 之 后 ， 程 序 就 能 像 前 面 - 样 从 第 上 层 读 出 dd 了。 例如， 在 
图 622 中 ,在 第 k lara 12 中 的 “个 数据 对 象 ， 会 导 玻 一 个 缓存 不 命中 ， 因 为 块 12 当前 不 在 第 
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k ERT P. HIER 12 从 第 kel EF 8/08 k 层 之 后 ， 它 就 会 保持 在 那里 ， 等 待 稍 后 的 访问 。 


m R mi 

区 分 不 同 种 类 的 缓存 不 命中 有 时 候 是 很 有 帮助 的 。 如 果 第 k EBORE Ц, MAREN М 
象 的 访问 都 会 不 僵 中 。 一 个 宇 的 缓存 有 时 被 称 为 疹 缓 存 〈pold cache)， 此 类 不 命中 被 称 为 强制 性 不 命 
T (compulsory miss) 或 冷 不 命中 (сой miss)。 冷 不 命中 很 重要 ， 因 为 它们 通常 是 短暂 的 事件 ， 不 会 
在 稳定 状态 中 出 现 ， 稳 定 状 态 指 的 就 是 在 反复 的 存储 器 访问 已 经 将 缓存 变 胜 【warmed ир) 了 之 后 。 

只 要 发 生 了 不 前 中 ， 第 下 层 的 缀 存 就 必须 执行 某 个 磷 撞 策略 ， 确 定 把 它 从 第 К+ 层 中 取出 的 据 
让 在 哪里 。 最 灵活 的 替换 策略 是 允许 来 自 第 k+1 层 的 任何 幢 放 在 第 k 层 的 任何 块 中 。 对 于 存储 器 层 
К ЕЕН СЕ CPU》， 它 们 是 用 硬件 来 实现 的 ， 而 且 速 度 是 最 优 的 ， 这 个 策略 实现 起 
来 通 冲 很 昂贵 ， 因 为 随机 地 放置 抉 ， 定 位 起 来 代价 很 高 。 

因此 ， 而 忻 缓 存 通 馆 生 用 钧 是 更 严格 的 放置 策略 ， 这 个 策略 将 第 k+1 层 的 某 个 抉 限制 放置 在 第 
k 层 块 的 一 个 小 的 子 集中 CS RET EO. Bin, ЖЕН 622 中 ， 我 们 可 以 确定 第 kel ЕМІ 
必须 放置 在 第 k 层 的 抉 (i mod 4) 中 。 例 如 ， 第 k+l 层 的 据 0、4、8 和 12 会 映射 到 第 kk 层 的 块 0， 
1. 5. 9 和 13 会 映射 到 块 1， 依 此 类 推 。 注意 ， 图 6.22 中 我 们 的 示例 缓存 使 用 的 就 是 这 个 策 团 。 

这 种 限制 性 的 放 署 策略 会 引起 一 种 不 命中 ， 称 为 冲突 不 命中 〈conflict missy， 在 这 种 情况 中 ， 
组 存 趾 够 人 ， 能 够 保存 被 引用 的 数据 对 象 ， 但 是 内 为 这 些 对 象 会 映射 到 同 -- 个 缓存 块 ， 钥 存 会 一 直 
不 命中 。 例 如， 在 图 6.22 中 ， 如 果 程 序 请 求 块 0， 然 后 热 8， 然 后 块 0， 然 后 区 8， 依 此 类 推 ， 在 第 
fk 层 的 缓存 中 ， 对 这 两 个 块 的 每 次 引用 都 会 不 全 中， 即使 是 这 个 缓存 总 共 可 以 容纳 4 个 块 。 

程序 通常 是 按照 一 系列 阶段 例如， 循环 ) 来 运行 的 ， 每 个 阶段 访问 绿 存 所 的 某 个 相对 稳定 不 
变 的 集合 。 例 如 ， 一 个 幅 套 的 循环 可 能 会 反复 地 访问 同一 个 数组 的 元 素 。 这 个 块 的 集合 被 称 为 这 个 
阶段 的 工作 集 (working set)。 当 工作 和 集 的 大 小 超过 缓存 的 大 小 时 , 强 存 会 经 历 容量 不 命中 Capacity 
miss)。 换 可 话说 ， 缓 存 就 是 大 小 了 ， 不 能 处 理 这 个 工作 集 。 

ЖИЕН 

ЕЧ О, Е ЕА А LE. ЕЮ АВНЕ — EHRT. E- 
EL. ЖАЛЕ НИЕ ЕТТ. 0X E. ФИТНА BE ЕЛКИ ШУНЫН. TET 
BJ АДЕЛ, Е ЕРИ DEF., ЖИЕП. ЕНЕР Е. ЭЧЕ, zd 
两 者 的 结合 。 

例如 ， 编 详 器 管理 寄存 器 文件 ,缓存 层次 结构 的 最 高 层 。 它 决 定 当 发 生 不 命中 对 何 时 发 射 加 载 ， 
以 及 确定 哪个 寄存 器 来 存放 数据 。L1 和 L2 层 的 缓存 完全 是 由 内 置 在 缓存 中 的 硬件 逻辑 来 管理 的 。 
在 一 个 有 虚拟 存储 器 的 系统 中 ，DRAM 主 在 作为 存储 在 磁 稳 上 的 数据 英 的 缓存 ， 是 由 操作 系统 软件 
和 CPU 上 的 地 址 翻译 硬件 共同 管理 的 。 对 于 一 个 具有 像 AFS 这 样 的 分 布 式 文件 系统 的 机 器 来 说 ， 
本 地 磁 描 作为 缓存 ， 它 是 由 运行 在 本 地 机 器 上 的 AFS 客户 端 进程 管理 的 。 在 大 多 数 时 候 ， 组 存 部 是 
自动 运行 的 ， 不 需 课程 序 采 取 特 殊 的 或 显 式 的 行动 。 


632 存 情 器 层次 结构 概念 小 结 


概括 来 说 ， 闻 储 器 层次 结构 行 之 有 效 ， 是 因为 较 慢 的 存储 设备 比较 快 的 存储 设备 更 便宜 ， 还 因 
为 程序 倾向 于 展示 局 部 性 ， 
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€ 利用 时 间 局 部 性 ;根据 对 间 局 部 性 ， 问 -数据 对 象 可 能 会 被 多 次 使 用 。 一 旦 一 个 数据 对 象 
在 第 一 次 不 命中 时 被 拷贝 到 缓存 中 ， 我 们 就 会 期 望 后 面 对 恋 日 杯 有 一 系列 的 访问 谷中 。 因 
为 缓存 比 低 层 的 存储 设备 更 快 ， 对 后 面 的 命中 的 服务 会 比 最 开始 的 不 命中 快 很 多 。 
. 利用 空间 局 部 性 ， 块 通常 包含 有 多 个 数据 对 象 。 根 据 空间 局 部 性 ， 我 们 会 期 轧 后 面 对 鼎 志 
中 其 他 对 象 的 访问 能 够 补偿 不 命中 后 拷贝 该 块 的 花费 。 
现代 血统 中 到 处 都 使 用 了 缓存 。 正 如 从 图 6.23 中 能 够 看 到 的 那样 ，CPH 5. BERA. A 
式 文件 系统 中 和 万 维 网 上 都 使 用 了 缓存 。 各 种 各 样 硬 人 忻 和 软件 的 组 合 构成 和 管理 着 组 在。 注意 ， 图 
623 中 有 大 量 我 们 还 未 涉 皮 到 的 术语 和 缩写 。 在 此 我 们 包括 这 些 术语 和 缩写 是 为 了 说 明 常 见 胸 缓 存 
是 什么 样子 的 ， 


级 存 的 内 容 被 组 存在 何 处 
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图 6.25 组 存 在 现代 计算 机 系统 中 无 处 趟 在 
TLE: ЕНЕР Clransianon Lookaside Buffer); MMU: FMRE IA m (Memory Management Шш); OS; RERI 
(Operating System; AFS: 安德鲁 文件 系统 (Andrew File System), NFS: УРЕ iNetwork File System). 
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早期 计算 机 系统 的 存储 器 忌 次 结构 只 有 三 导 ， CPU 寄存 跟 、 主 DRAM 存储 器 和 磁极 存储 设备 。 
不 过 ， 由 于 CPU МЕА З КАО, ЖЕО НАТЕ CPU 寄存 器 文件 和 主 存 之 间 搬入 
I -个 小 的 SRAM 存 情 器 ， 称 为 Ll Ана € -级 缓存 }。 在 坝 代 系统 中 ，L1 高 速 缓存 位 于 CPU 
忆 片 上 (也 就 是 ， 它 是 芯片 上 的 高 速 组 存 )， 如 图 6.24 所 不 。L1 高 速 缓存 的 访问 速度 几乎 和 寄存 器 
一 样 快 ， 典 型 地 尾 1 个 或 2 个 时 钟 周期 。 

ШЖ CPU 和 主 存 之 间 的 性 能 差距 不 断 增 大 ,系统 设计 者 在 Ll 高 速 强 存 和 主 存 之 间 叉 插入 了 一 个 
BOR, 称 为 L2 高 速 组 看， 可 以 在 几 个 财 钟 周 期 内 访问 到 它 。 可 以 将 L2 高 速 缓存 连接 到 存储 器 总 
线 ， 戚 者 连接 到 它 自己 的 高 速 缓存 蕊 线 (cache bus), ШЕ 6.24 所 未 。 有 些 高 性 能 系统 ， 例 如 那些 基 
T Alpha 21164 的 系统 ， 甚 至 填 在 存储 器 总 线 上 还 有 一 屋 高 速 缓存 ， 称 为 L3 S kika, CERAR 
位 于 L2 Ж ЕЕ E. BRERA ЕҢ ЕНЕ, (ШЕ-ЕНОЕЛІГІ Е-Е. 


6.4.1 ЖШШЕ ERE TEE ТЕ А 
FEDERA, ЕТІНЕН m y, ER М = ?个 不 同 的 地 址 。 如 图 6.25 (а) 
所 示 ， 这 样 - 个 机 器 的 蜗 速 缓存 被 组 织 成 一 个 了 = 天 个 高 速 缓存 组 【cache set) 的 数组 。 每 个 组 包含 
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-RIR МЗ ЖНА ЛЫН (SEBm) 来 描述 。 高 速 缓存 的 大 小 【或 容量 ) C 指 的 
是 所 有 号 的 大 小 的 和 。 标 记 位 和 有 效 位 不 包括 在 内 。 因此, С-5ХЕХВ, 

当 一 条 加 载 指令 指示 CPU 从 证 存 地 址 4 中 读 - -个 字 时 ， 它 将 地 址 上 ЛАНА. ШЕН 
速 缓存 下 保 在 着 地 址 4 处 邦 个 字 的 拷贝 ， 它 就 立即 将 那个 宁 发 回答 CPU. ЯВА ARRA АЛ АТ 
是 否 包含 地 址 А 处 那个 字 的 找 由 的 昵 ? 高 速 缓存 的 结构 使 得 它 能 通过 简单 地 检查 地 址 位 ， 发 现 所 请 
求 的 字 ， 类 似 于 使 用 极其 简单 的 哈 希 蝴 数 的 哈 希 表 。 下 面 就 是 它 是 如 何 工作 的 ; 

参数 9 和 有 中 将 站 个 地 址 位 分 为 了 个子 段 ， 如 图 6.25 (b) 所 示 。4 中 5 个 组 膏 引 位 是 一 个 到 5 
个 组 的 数组 索引 。 第 一 个 纽 是 组 0， 第 一 个 组 是 组 1， 依 此 类 推 。 当 作为 一 个 匹 符号 吾 数 解释 时 ， 组 
索引 位 告诉 我 们 这 个 字 必 须 存储 在 哪个 组 中 。 一 旦 我 们 知道 了 这 个 字 必 须 放 在 哪个 组 中 ,A 中 的 + 
个 标记 位 就 告诉 我 们 这 个 组 韦 的 嘱 dT CURAR Bx. SRP R SM 
行 的 标记 位 与 地 址 4 中 的 标记 位 由 匹配 时 ， 组 中 的 这 TB SX T. 有 旦 我 化 在 由 组 索引 标识 的 
组 中 定位 了 由 标号 所 标识 的 行 ， 那 么 Bb 个 块 偏 称 位 给 出 了 在 BB 个 字 节 的 数据 块 中 的 学 偏 移 。 

你 可 能 已 经 注意 到 了 ， 对 噩 速 组 仓 的 描述 使 用 了 很 多 符号 。 图 6.26 对 这 些 符号 做 了 个 小 结 ， 供 
你 参考 。 


组 数 

tT Ж 

B OM 
(ff) ЖЫН 


M =" 存储 器 地 址 的 最 大 数量 

y = 10825) "RS endi 

b = loga ð} Ha OC NE 

[= mo b) ДЕ 

С-В x Е x $ МӘН SAW НИ АМАНДА АҒАР Cy h) 





图 5.26 高速 组 存 参数 小 结 


练习 题 6.6 


下 表 给 出 了 几 个 不 同 高 速 缓 育 的 参数 ， 确 定 每 个 商 速 姓 序 的 高 速 缓 育 组 数 【S】， 标 记 位 数 Co. 
Kala (РРА НЕ (р). 
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—|re-sein 





mo27 RHSHESES (1-1) 
арча д0 


假设 我 们 有 这 样 一 个 系统 ， 它 有 一 个 CPU. СЕ. — L АН. 
当 CPU 执行 一 条 读 存 彤 器 字 w Efe. I LI ЖЕННИ RIK T. ШЕП ИТН w 的 一 
TERNET. NARRA LI BOB h, Wiki itb HRH w HEERE СРЈ. d 
Шынай. ЗЫН ЕНЕ А v 的 块 的 一 个 拷贝 时 ，CPU 必须 等 恬 。 当 
ЖИ ЖИЙ tr REM. L ARATA hiik — SANT. ЖЕЗЕМІН 
Bp phiU? w MERCER СРО, WERA MERET. EARE ERN T 
WIE 54-5. OAA: CRER: SFAR. 


PESER H ТЕМА 

Е — р, ЖҮ, w ТЕҢЕШКЕН |, 3510. НЕМЕН ВЕЕ 
ШӨМЕН. WARR ШЕГШЕ АЛ IER RE- ЕХ H. дінін 
sk rac Е - AR RAAR. Mo Жл T ИЕК ТОНЕ I ТҮРІП, E 
个 例子 中 ， 组 索引 位 00001, 被 解释 为 一 个 选择 组 1 MERE. 





i irl 
(d sy С bit 
———— 3889915... 
m-i 


Ек НЕЗ ван 
图 4.28 MARREN REE hE 
канан UG | 
既然 在 上 一 步 中 我 们 已 经 选择 了 基 个 组 i， 接 下 来 的 一 步 总 要 确定 是 否 有 字 w 的 一 个 持 贝 存储 
在 组 i EAR MAR. ERRA, B, ПОЕНА, BERNA 
只 有 一 行 。 当 且慢 当 设 者 了 有 效 位 , ALARA PARTS w 的 地 址 中 的 标记 相 匹 配 时 ， 这 一 
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行 中 包含 w 的 一 个 挡 幢 。 
E 629 展 水 了 自 接 映射 疝 速 缓存 中 行 丐 机 是 如 何 工作 的 。 这 个 行 的 大 效 位 竣 置 了 ， 所 以 我 们 和 如 
道 标 忆 中 狗 位 和 块 是 有 意义 的 。 内 为 这 个 高 速 缓存 行 中 的 标记 位 与 地 址 中 的 标记 位 相 匹 配 ， 所 以 我 
人 知道 我 们 想 要 的 那个 字 的 一 个 接见 确 实 存 情 在 这 个 行 中 。 换 句 话 涪 ， 我 们 得 囊 一 个 饮 存 命中 。 男 
-方面 ， 旭 果 有 效 位 没有 设置 ， 或 者 标记 术 相 十 配 ， 混 么 我 们 就 得 到 一 个 缓存 不 命中 。 
= 1? (ЖЕЗ ИП. 






9 1 2 3 4 5 5 T 
А (0: Са Се e) | 
{Зу ср 和 人) 满足 ， 
(т й EAE E Тет. ЖЮ 
这 位 必须 与 地 址 中 仿 称 就 选择 出 了 起 始 
的 标记 位 相 匹 配 ， р, 
8 b fi 
г опо | i | 10 | 


m-t 0 
标记 йж RRE 


图 629 直接 映射 高 速 租 存 中 的 行 匹 配 和 宇 选 择 
I BERE. жол w 的 低位 宇 节 ，wi 昆 下 一 个 字 节 。 居 此 类 推 


REUS 0 CE Eripe RE 

一 旦 命中 , 我 们 知道 м НЕ ЖЛ. URL THE GE PTS SERIE Eh h EUER 
的 。 如 图 6.29 Bros, RREA ЕЙ Pr SERE ERISS x "ШИН. 就 像 我 们 把 高 速 缓存 看 
成 一 个 行 的 数组 一 样 ， 我 科 把 块 看 成 -个 字 节 的 数组 ， 而 字 节 偏 移 是 到 这 个 数组 的 - -个 索引 。 在 这 个 
WAT, RREME 100,， 它 表明 w 的 拷贝 是 从 块 中 的 字 节 4 开始 的 (我 们 假设 学 长 为 4 字 节 )， 


直接 也 射 高 速 缓存 中 不 命中 时 的 行 换 

如 果 高 速 绥 存 不 命中 ， 半 么 它 需 要 从 存储 器 层次 结构 中 的 下 一 岩 取 出 被 请 求 的 块 ， 然 后 将 新 的 
泼 存储 在 组 索引 位 指示 的 组 中 的 一 个 高 速 缓存 行 中 。 一 般 而 吉 ， 如 时 组 中 都 是 有 效 高 速 缓存 行 了 ， 
那么 当 须 要 驶 逐 出 一 个 现存 的 行 。 对 于 直接 映射 高 速 缓存 来 滴 ， 每 个 组 只 包含 让 - Gs өлен 
党 简单 ， 用 新 取出 的 行 替 换 当前 的 行 。 


fr: 还 行 虽 的 直接 映射 高 速 线 存 

局 速 绥 仓 用 来 选择 组 和 标识 行 的 机 制 极其 简单 。， 必 须要 这 样 ， 因 为 厂 件 必须 在 见 个 纳 秒 的 时 司 
内 完成 这 些 工作 。 不 过 ， 用 这 种 方式 来 处 理 位 对 我 们 人 来 说 是 很 令 人 国 惑 的 。 一 个 具体 的 例 地 能 帮 
助 解释 清楚 这 个 过 程 。 假 设 我 们 存 -个 直接 映射 高 速 缓存 ， 措 述 吉 下 

(GS, E, B, m) -44,1,2,4) 

балай НИ ЛТ, STI. ВЕЛ 2 Кез, ШИШЕ. МН. RD 
ҚУ ҮС. ЧЖАН 一些 假设 完全 是 不 现实 的 ， 但 是 它们 能 使 杰 例 保持 简单 。 

如 果 你 切 学 澡 速 缓存 ， 列 举 出 整个 地 址 空间 并 划分 好 位 ， 是 很 有 帮助 的 ， 就 像 我 们 在 图 6308 
我 们 4 位 的 示 别 所 做 的 那样 。 头 于 这 个 列举 出 的 空间 ， 有 {1 К НАН. 

《标记 位 和 索引 位 连 起 来 惟一 地 标识 了 存 情 器 中 的 每 个 岂 。 例 如 ， 块 0 是 由 地 址 0 和 1 组 成 


存储 器 层次 结构 419 


的 ， 块 1 是 由 地 址 2 和 3 组 成 的 ， 块 2 Ep E 405 RES, KERE., 
e 因为 有 8 个 存储 器 块 ， 但 是 只 有 4 个 享 速 缓存 组 ， 多 个 块 映射 到 同一 个 高 速 绽 存 组 “也 诚 
是 ， 它 们 有 相同 的 组 索引 }。 例 如 ， 抉 0 和 4 都 映射 天 组 0， 拉 | HL S ВЕРЕЯ 1, Ж. 
о 映射 到 同一 个 高 速 组 存 组 的 块 由 标识 位 惟 -地 标识 。 例如, Ж 0 的 标识 位 为 0, TER 4 的 标 


识 位 为 1， 抉 1 的 标识 位 为 0， 而 块 5 的 标识 科 为 1， 
(HEH) 
Ü 





‘十进制 } (1) (s=?) (61) 
0 0 00 





ғ ә ш = t — с -= із oco ш =— = — ш — m= 


6.90 ЛАИН EE ETE 4 位 地 址 空间 
让 我 们 来 模拟 一 下 当 СРО 执行 “系列 读 的 时 候 ， MERANI. АҒА УАР, R 
们 假设 CPU k 1 字 节 的 字 。 有 虽然 这 种 手工 的 模拟 很 乏味 , 你 可 能 想 丰 跳 过 它 , 但 是 根据 我 们 的 经 验 ， 
硅 学 生 们 经 历 过 珊 速 缓存 是 如 何 工作 的 之 前 ， 他 们 是 不 能 真正 理解 的 。 
初始 时 ， 缓 存 是 空 的 《也 就 是 ， 每 个 有 效 位 都 是 0): 





过 中 的 每 一 行 都 代表 “个 高 速 缓存 行 。 第 一 列表 明 该 行 所 属 的 组 ， 但 是 请 记 住 提供 这 个 位 只 是 
为 了 方便 ， 实 际 上 它 并 不 真是 缓存 的 一 部 分 。 后 面 四 列 代表 每 个 高 速 缓存 行 的 实际 的 位 。 现 在 ， 让 
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我 们 来 看 看 当 CPU 执行 一 系列 读 时 ， 部 发 生 了 什么 ; 

1. 地 址 0 的 字 。 国 为 组 0 的 有 效 位 是 0， 是 绥 存 不 命中 ， 印 速 缓存 从 存储 器 (成 低层 的 高 速 
OUO OH IR 0, 并 把 这 个 块 存储 在 组 0 中。 然后, ЕЛНАР ҮНІ ЛІ МӘН mI] 
(存储 器 位 置 0 的 内 容 )。 





2. 读 地 址 1 的 宇 。 这 次 会 缓存 命中 ,点 速 缓存 立即 从 和 误 速 缓存 行 的 块 [中 返 岂 mls ІНІ 
存 的 状态 没有 变化 ， 

3. 读 地 址 13 的 字 。 由 于 组 ? 中 的 沿 速 缓存 行 不 是 有 效 的 ， 所 以 有 缓存 不 命中。 岛 速 缓存 把 块 
6 加 载 到 组 2 中 ， 然 后 从 新 的 高 速 缓 瞪 行 的 块 [1 中 返回 m3) 





4. 读 地 址 8 EE. IX DUET AE Тат. НО МНЕ mi m3 ex. {Н ЖОЛОЙ. 
OSEE 4 加 载 到 组 心中 【替换 读 地 址 ОВА КЕ), ЯЛА ШЕ OUEST T 
返回 m[8|。 





5. 读 地 址 的 学 。 义 会 发 生 缓 存 不 命中 ， 因 为 在 谭 面 引用 地 址 8 АЧ. HEU IRURE HAT Br 0。 这 
三 是 冲突 不 谷中 的 一 个 例 季 ， 也 就 是 我 们 有 足够 的 高 速 缓存 空间 ， 但 是 变 蔡 好 引用 映射 到 同 … 个 组 
WIR. 


“а [ws [see xe | ж” 


Ü [0] mii] 
1 mi 17] m[I3) 


直接 映射 高 速 缓存 中 的 冲突 不 命中 
冲突 不 命中 在 真实 的 程序 中 很 常见 ， 会 导致 令 人 困惑 的 性 能 问题 。 当 程序 访问 大 小 为 2 ЖЕНЕ 






0 l 
l 0 
2 | 
3 0 
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ЖОНЕ, АЯ R D aK ОЕ EA Р, ЯШ, 8 FRP НЕН А Ж. 
float dotprod(float x[8], float y[8]) 
L 
float sum = 0.0; 
int 1; 
for {i = 0; 1 < B; i+-) 
sum += x[i] * yli]; 


1 
2 
3 
4 
5 
б 
- 
8 return sum; 
9 


} 

对 于 x 和 y 来 说 ， 这 个 函数 有 良好 的 局 部 性 ， 因 此 我 们 期 望 它 的 命中 率 会 比较 高 。 不 笠 的 是 ， 
并 不 总 是 如 此 。 

假设 浮 点 数 是 4 个 字 节 ,x 被 加 载 到 从 地 址 0 开始 的 32 字 节 连 续 存储 器 中 , y 紧 跟 在 x 之 后 ， 
从 地 址 32 开始 。 为 了 简便 ,假设 一 个 块 是 16 个 字 节 (足够 容纳 4 个 浮 点 数 )， 高速 缓存 出 两 个 组 组 
成 ， 和 局 速 缓存 的 整个 大 小 为 32 字 节 。 我 们 会 假设 变量 sum 实际 上 存放 在 一 个 CPU 寄存 器 中 ， 因 此 
不 需要 存储 器 引用 。 根 据 这 些 候 设 每 个 [0 和 аана 





ЁЛ, ТАЈ ОКН x[0]， 缓 存 不 命中 会 导致 包含 x[0] 一 x[3] 的 块 被 加 载 到 组 0。 
接 直 来 是 对 y 扣 ] 的 引用 ， 又 一 次 缓存 不 命中 ， 导 致 包 例 y[0]7- y [3] RR DESIER 0, RE E 207] 
HANERE x 的 值 。 在 下 一 次 过 代 中 ， 对 xfl] 的 引用 不 命中 ， 导 致 xlI0] 一 x[3] 的 块 被 加 载 回 组 0, 
TER [0] 一 y[3] 的 其 ， 因 而 现在 我 们 就 有 了 一 个 冲突 不 命中 ， 而 实际 上 后 面 每 次 对 x 和 的 引用 
部 会 导致 冲突 不 命中 ， 我 们 就 在 x Ж у 的 块 之 间 拌 动 (thrasp)。 术 语 “ 和 抖动 ”描述 的 是 这 样 一 种 情 
况 ， 其 中 蜗 速 缓存 反复 地 加 载 和 驱 加 高速 缓存 其 相同 的 组 。 

| Ж ЖАЙ Ж. 即使 程序 有 良好 的 空间 局 部 性 , 而 我 们 的 高 速 绽 存 中 也 有 足够 的 空间 来 存放 xi] 
和 四 的 鼎 ， 每 次 引用 述 是 会 导致 神 突 不 命中 ， 这 是 因为 这 些 块 被 观 射 到 了 同一 个 高 速 缓 存 组 。 这 
种 拌 动 如 至 速度 目 降 2 或 3 倍 并 不 稀 背 。 另外， 还 要 注意 虽 榴 我 们 的 示例 极其 简单 ,但 是 对 于 更 大 ， 
更 现实 的 直接 映射 高 速 缓 存 来 说 ， 这 个 问题 也 是 很 真实 的 。 

幸运 的 是 ， 一旦 程序 员 意 识 到 了 [在 发 生 慎 么 ， 就 很 容易 修正 拌 动 问题 。 一 个 很 简单 的 方法 是 
在 每 个 数组 的 结尾 放 B 字 节 的 填充 。 例 如 ,不 是 将 x ЖОЖ float x[8]， 而 是 定义 成 float x12). # 
设 在 存储 器 中 YY 紧 跟 在 x 后面 ， 我们 有 下 面 这 样 的 从 数组 元 素 到 组 的 映射 : 
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a[i] 
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在 x А ГАЖ. ПЕ iB ЕЖЕН T ЖН Ж. ИКТ fh bsp 
5 51H 6.7 


在 前 面 dotprod 的 个 手中 , AANA x ICT dO 6, Bom de у ni eedem RE Fn 
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I 51H 6.8 
-RRi HR- khi з ARE maium Nu Ek HHE-—T adu 
5, 
A. ib SE ЖННД (chunki) PA Éy dee? 
В. ФТ, тана- ЖЕНЕ (5ЕВл!-1512,1,2,32) HAEL: 
int аггау [4096]; 
Гог ii = Ü; i < 4096; i++) 
aum += array[i]l; 
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fries gp {Р haba A р НЕТИ RN ТЧ 8-1 OE. ЕЖП 
描述 就 是 巨 = 1) ЕРЕН. MARAEA (set associative cache) WT X ӨМ. БЕІН 
ШЕТЕН ТАЕ Т. IeEcCBÜIOEOLHLIUR IEEE BUTLER ҮТ. 在 
Кип. ФПЖ {ЕЁ E= СВ ТАЙТ. H6ximWonI—T2BHOBERZES (ng. 





图 632 SWRNGESH (| < F< C/B) 
THP Et. W Et TET HORT. ЕНЕ AN I 2 LER GR EUR 
LITT ЕНЕ, 
БА ЕЕ FEIER АЕН ЕНШЕ. SERES UR. Hes Ti TUE, 


HIHI i a ТГ RR 

ИНК ЕНТ np rg Fr ORE LEAL He EUR ЧЕ РЕ ИЖ. DOSE e UE E Er cia tr 
Rmi, baie ЛПИЖ ЕДК ERS p., — T EHE ERE T CS URL. ELE PEU MCA. 
МЕДЕ ПНЕ ИЗЕП ИШЕТИН. AA ТУЗЕТ ЈЕ F Ckey, value). МИНЕ, Dl key 
为 办 入， 返回 与 输入 的 key НЕНІ (кеу,уаше) 对 中 的 value (8. Б. RiT ELE SLE Wik aN 
性 中 的 鲜 个 组 静 看 成 一 个 小 的 组 相 联 存 赃 器 ，key 是 标记 和 有 效 位 ， 而 value WERNA W. 

图 丰 科 展示 了 组 相 联 高 速 鳃 存 中 行 区 配 的 基本 思想 , 这 里 的 一 个 重要 因 物 就 是 组 中 的 在 何 一 行 
各 可 以 包 辣 性 何 哑 射 到 这 个 组 的 存储 器 拨 。 所 以 高 违 缓存 必须 搜索 组 中 的 每 一 行 ， 寻 技 一 个 有 将 的 
Тт. еа АЛЕН ВР ЕАС. АИТВ АГАЕ. ШАВИ ЯТ, ВАВА 
ТЕЕ, np. 


424 E63 





udo ДЕП аа 
图 633 组 相 联 商 速 缓存 中 的 组 选择 
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Selacted set (i): 


(1) ШЕСІ 和 和 (2) ХЕ, 
ЖАЋЯ НТ. HA 


(20 НИЕНІ T. -7 
Riku АО pk 


"Н фла, ЭЛН БАЕ EHE Ó. 
Р 54у b^r 
m-i Ü 
by ie жо! BRE 
图 5,54 ННКЖЯЯЕЕСІЛЕН ТА 
弓 相 庶 高 速 缓存 中 不 命中 时 的 行 替换 
WE CPU 请 求 的 字 不 在 组 的 任何 一 行 中 , 那么 就 是 不 命中 ,高 速 缓存 必 须 从 存储 器 中 取出 包含 


ЖЕНЕ. К, ААН ГЬ, ИТЧЕ? К, Bt 717, ЖЕ 
gue ОНЕ. Ue RE Р НЕТ. MARIAAN ERA, ЖШ CPU 不 会 很 快 引 
МТА 817 

程序 员 很 难 在 他 们 代码 中 利用 高 速 缓存 替换 策略 ， 所 以 在 此 我 们 不 会 过 多 邮 讲 述 其 细节 。 最 简单 
的 玲 换 策略 是 随机 网 择 归 和 苦 换 的 行 。 其 他 更 复杂 的 策略 利用 了 局 部 性 原型 ， 以 使 在 比较 近 交 将 来 引用 
币 登 换 的 行 的 概率 最 小 。 例 如 ， 最 不 常 使 用 【least-frequently-used，LFU) 策略 会 替换 在 过 去 某 个 时 间 
窗 门 内 引用 次 数 最 少 的 那 - 行 。 最 近 最 少 使 用 (jeast-recently-used，LRU) 策略 会 替换 最 后 -- 次 访问 
时 间 最 入 还 的 划一 行 。 所 有 这 些 策略 都 需要 额外 的 时 间 和 硬件 。 但 是 ， 越 往 存储 器 层次 结构 下面 起， 
远离 CPU， 一 次 不 命中 的 开销 就 会 更 加 昂贵 ， 用 更 好 的 蔡 换 策略 使 得 厅 丛 中 最 少 也 变 得 更 加 悄 得 了 ， 


644 ФЕ 
АНА (fully associative cache) 是 由 一 个 包含 所 有 高速 缓存 行 的 组 (也 就 是 , E= 
C/B) 组 成 的 。 图 635 给 出 了 基本 结构 。 
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ТЕНЕ ГАНАА Н 

D E Pep s HERE ЕЁ. НА TEL. езе 8 TT 55. 注意 地 址 中 设 有 
ШЖ. dup LH Г ло TRAH. 

HII E np LAC RE ERR 

4c REC UR ЕН ТИТИ RUE Е — I IEUEC EUR PHEN. 如 图 6.37 所 示 。 它们 
СІНЕН Ж REPRE K AANE. 
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НМ ИН ЕРТЕН ЖЕЛ ҤЕ ROGO. MINE TX K Y th R SERO EE PR 
Ж, ШАВ. Sn, “ШК Es GAS UBRO. TIUS ABER 
НТТР ТІВ), ТЕРЕ (10.6.2 31), 

ЖЫН 6.9 

下 面 的 问题 能 帮助 你 加 强 理解 高 速 缓存 是 如 何 工作 的 。 有 如 下 假设 ; 

在 储 器 是 宇 节 寻 址 的 。 

(fHEBOSVEITTEOPTUCURSEATYTEDT) 

e 地 址 的 宽度 为 13 位， 

. 高速 缓存 是 2 路 组 相 联 的 【下 = 了)， 块 大 小 为 十字 节 (日 =4)， 有 8 不 组 (5=8). 

高 速 缓存 的 肉 容 如 下 ， 所 有 的 数字 都 是 以 十 六 进 制 来 表示 的 : 


0 
45 


ЕВ 


1 
9] 
46 





] 
Ü 
06 ü 
C] 1 
| 
1 
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于 面 的 方 框 展示 的 是 地 址 格式 【每 个 小 方 框 一 个 位 )， 指 出 { 在 图 中 标 出 ) 用 来 确定 下 列 内 容 的 
TE 


CO ЖЖ AH S 
СІ ЗЕН 
CT maki iki 


СІН 6.10 


TUR — А-1 45414 69 中 的 机 器 上 , 它 引 用 地 址 0x0E34 Жр TUE Y, euer es а 
ЖАНҒАНЫ АННАН SA EPA. 指出 是 否 会 迪生 缓存 不 命中 ， 如 果 会 出 现 缓存 不 
命中 ， 用 “-” 来 表示 “返回 的 高 速 绪 存 字 节 ”"， 

А. 地 址 格式 (每 个 小 方 框 一 个 位 】; 
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645 ”有关 写 的 问题 

正如 我 们 看 到 的 , 高 速 缓存 关于 读 的 操作 非常 简单 。 首先, 在 高 速 组 存 中 查找 所 需 字 w f UL. 
imp, ERPF w 给 CPU。 邵 果 不 命中 ， 从 存储 器 中 取出 包含 平 УША. Ric BUPBER 
某 个 启 速 缓存 行 中 可能 会 驱逐 一 个 有 效 的 行 )， 然 后 将 字 w 返回 给 CPU. 

写 的 情况 就 要 复杂 一 些 了 。 假设 CPU 写 个 已 经 缓存 了 的 字 wW [ 写 命中 (write hit)]。 在 高 速 
缓 人 在 更 新 了 它 的 w HANZE. EAEN w 在 存储 器 中 的 拷贝 呢 ? 最 简单 的 方法 ， 称 为 直 写 
{write-through)， 就 是 立即 将 w 的 冯 速 缓存 块 写 回 到 存储 器 中 。 ВХ, 但 是 直 写 的 缺点 是 每 条 
存储 指令 孝 会 引起 总 线 上 的 一 个 号 事务 。 另 一 种 方法 ， 称 为 写 国 【write-back]， 尽 可 能 地 推迟 存 情 
器 更 新 ， 几 有 当 蔡 换算 法 要 驱逐 已 更 新 的 块 时 ， 才 把 它 写 到 存储 器 。 由 于 局 部 性 ， 写 回 能 显著 地 减 
少 总 线 事务 的 数量 ， 但 是 它 的 缺点 是 增 如 了 复杂 性 。 高 速 缓存 必须 为 每 个 高 速 缓 存 行 维护 :个 额外 
的 修改 位 (dirty bit), ЗН F A ER ri E TAE. 

5 hj xe Sp REED. -种 方法 ， 称 为 写 分 配 《write-allocate )， 加 载 相 应 的 存储 器 
块 到 饥 速 缓存 巾 ， 然 后 更 新 这 个 商 速 缓存 堪 。 写 分 配 试 图 利用 写 的 空 昌 局 部 性 ， 但 是 缺点 是 每 次 不 
命中 都 会 导致 一 个 块 从 存储 器 疙 送 到 高 速 细 上 存 。 另 “种 方法 ， 称 为 非 吕 分 配 (not-write-allocate ), 
避 开 局 速 组 存 ， 直 接 把 这 个 学 写 到 存储 器 中 。 自 写 高 速 绿 存 通常 是 韭 写 分 配 的 。 写 回 向 速 角 存 通 常 
是 写 分 本 的 。 

为 号 操作 优化 高 速 绽 存 是 个 细致 而 轩 维 的 问题 ， 在 此 我 们 只 上 略 讲 皮毛 。 细 节 了 系 统 的 不 同 而 
Жа, 而 日 通 党 是 私有 的 ， 交 档 记 湛 不 详细 。 对 于 试图 编写 高 速 组 存 比 较 友 好 的 程序 的 程序 员 来 说 ， 
34118 DUAE S Hi - -个 使 用 写 叫 和 写 分 配 的 高 速 缓存 的 模型 ， 这 样 建 变 有 儿 个 原因 。 

Ж, НРК Ар, Е К РНЕ ЈЕ ВЕЕ НУ, теа Н, 
ИИ. ИЕК ОНЕЛТЕЛТЕ ЕН LEHRT) ВЕЕ Б. HER T ЕЕ 
EBRE НЫН ЛАНЫП ЖИЛ АШ Т. [ПЕ ИА ВТА EK E SEBEB ГЕ [EL 
速 缓 个。 所 以 这 种 假设 符合 当前 的 趋势 。 假 设 使 用 写 回 写 分 配方 法 的 别 -个 原因 是 ， 它 与 处 理 读 的 
方式 由 对称 ， 因 为 宇 问 写 分 配 试图 利用 局 部 性 。 因 此 ， 我 们 可 以 在 高 层次 上 开发 我 们 的 程序 ， 展 示 
恨 妈 的 罕 间 和 时 间 局 部 性 ， 而 不 是 试图 为 某 一 个 存储 器 系统 进行 优化 。 

646 指令 高 速 缓存 和 统一 的 高 速 缓存 

刘 日 前 为 目 ， 我 们 一 自 候 设 高 速 缓 存 只 保存 程序 数据 ， 不 过 ， 实 际 上 ， 高 速 缓存 既 保 存 数据 ， 
也 保存 指令 。 只 保存 指令 的 商 速 缓存 称 为 Peache。 只 保存 程序 数据 的 高 速 缓存 称 为 d-cache。 既 保 
存 指 邻 义 包括 数据 的 高 速 缓存 称 为 入 一 的 高 速 绿 存 (unified cache)， 一 个 典型 的 桌面 系统 CPU 45H 
本 身 就 包括 一 个 Lli-cache 和 :个 L1 d-cache。 图 6.38 总 结 了 基本 的 结构 。 

CPU 


L1 d-cache 


图 6.58 ”一 个 典型 的 多 层 高 速 缓存 结构 
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H aka Ж, mimi T Alpha 21164 Ж, HELI AUL2 ЙІНЕ CPU p E, Ж 
TE — PB). Eh ЕМІЗЕ. АРТ R rti. ШКА И IER FE CIS ES Н EI cache 
Ml ӛссе. WBS MO ТОЙ ҮҮ. ЕР ЕЕГ ТЕ 1—1 ЕВ ЛАА E ЧЕФТЖ- ЖІТІ. 
ARRE НАНЕ T L БШ. ЕБЕНВЕНЦЫИНМЕМЕНЕНЕЖХ, miri 
不 太 可 能 出 再 这 样 的 情况 ， 


Au. винт ° 
Intl Реніш БЖ AR A HA ЖАНЫ 638 A ЯБА LA LI гек, - 

的 L1 беде, ER- ARESA EHLI- RANA, В 639 站 由 了 这 此 高 速 村 在 的 基本 

LETETI 

EHEM LI ы 

т ERLI d-ek 

| Té Hf LARET 
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647 高 速 缓 看 参数 的 性 能 影响 
trcs d ЖЕЛЕ PFE ИЕ; 
. Ж# Р Ж (miss mie), ФЕ — ТУРЕ ТАЕН C ЖЛ ASIE. ҮРЛИ ЖЕ її 
Kk. ЖАРИ. TAPRE. 
* PPE (hit al， 合 中 的 存 傅 器 引用 比率 ， 它 等 于 1—1 р. 
a 市 中 时 间 《hit time). MEE EIE TER CPU ТЕПН ПВ], а Е. НАН 
字 遗 撞 的 时间 。 对 于 LI 高 速 鳗 存 来 说 ， 命 中 时 间 频 型 的 是 1 一 2 PPE, 
. TPM (miss penalty)， 由 于 不 命中 所 需要 的 额外 的 时 间 。Li 不 谷中 需要 从 L2 得 到 服 
ЖЛЕ. ARE 5-10 个 周期 ,LI1 不 傅 中 需要 从 主 存 得到 腿 务 的 处 罚 ， 典 型 是 24—100 
个 周期 ， 
优化 高 速 认 存 的 威 本 和 性 能 的 折 中 是 一 项 祖 辅 包 的 工作 ， 它 需要 在 现实 的 甘 蕴 程序 代码 上 各行 
大 量 的 检 执 ， 因 此 考 出 了 我 们 讨论 的 范围 。 不 过 ， 还 是 可 已 认 识 一 些 定 性 的 折 让 ， 


ШИН АШ Ен 

ЯШ, S KR ИТПЕН Ж, 5-ТЕН ЕН E ñ Е — 
cmn. БЖ, Bm gor iE ИШЕ pH. LTB EW) LI ЯНҒАН ВАЗ 
E. AATA dir ШАБА A АА А. 

АНЫ 

AMRAH. m. WEICH ЕЛТІГЕН ЕМІН, Hd, 
Tn. ИТЕЕКЕЖӘНТАТ, Wak КИЖИ ЕЕН ТЕШ >, ёш КЕ H: s= [š] 
ЛОАРЕ ГОТИ ВЕДЕ PRI Ж. ЕХЕНЕЖафЕТЕНӨШЕНШ, Bobbi E. itn 
K. ЖИЕК ЕЙТ Р. {ЖИЫ 4-8 TE. 
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НЕЛЫН 

这 里 前 问题 是 参数 E ТАЗ Ж ТІ МЕНЕЕ, HERRE Cite E TI 
较 大 ) HEARRE Bx ds TN AT ШЕННЕ REESE. TAI. Ж КДУ ОН ЛИЗ 
向 的 成 本 。 较 高 的 相 联 度 实 秽 起 来 很 昂贵 ， 而 及 很 难 使 之 速度 变 快 。 每 一 行 需要 更 多 的 标记 位 ， 每 
—frd ES LRU 状态 位 和 额外 的 控制 逻辑 , 较 高 的 相 联 度 会 增加 命中 时 间 , 内 为 复杂 性 增加 了 ， 
另外 ， 还 会 增加 不 命中 处 罚 ， 因 为 选举 牺牲 行 (victim line》 的 复杂 性 也 增加 了 ，。 

由 联 度 的 选择 最 终 变 成 了 命中 时 间 和 不 命中 处 罚 之 间 的 折 中 。 传 统 上 ， 和 努力 争取 时 钟 频率 的 于 
性 能 系统 会 选择 直接 映射 11 高 速 缓存 ‘这 里 的 不 命中 处 罚 只 是 几 个 周期 ?， 而 在 较 低 层 上 使 用 比较 
小 的 相 联 度 〈 比 如 说 2~4)， 但 是 没有 固定 的 规则 。Intel Pentium RAP, LIA L2 高 速 缓存 是 4 
路 组 相 联 的 。Alpha 21164 系统 中 ，L1 指令 和 数据 高 速 缓 存 是 直接 映射 的 ，L2 ffr З ЕНІН 
联 的 ， 而 L3 mide Je А ЖЕЛП. 


S RT) RUM 

B Bo AUT CLE ES SEER, TU RLREGEHIE SOT E (write buffer), "dior ТЕ ЖЕН, BL M 
Wm. HOA, ТЕЛИ РАНА К, ВЗЯЛ ЖИНА. 3— 0h, SERRET 
| Ped Ee Seb, E AITES ТИРЕ ЕНЕ TE AUT DMA 的 UO 发 备 。 此 外 ， 越 往 忆 次 结构 
Pb. EERE, Hob fEIBTRGUESMENUEXE. EE. MERTE Pj. WA 
tif Inm ТАНЫ. 


5. ЕЗ. SEGURA ADM? 

КЕЛЖ GMAT. dek RES ÓIAJDAGM—TXDENE. AGGERE: 

4 WE- ERR EREE. GIkd4eiá&XL-AEGA4S4)IbEkwgd, 

. FEREARE aku A Kiti (Ha Rip) 的 容器 。 

e fE AREKEA, ХАВВА FAR d fra. amo emm v 

的 姐 是 由 名 个 行 姐 成 的 。 

在 直接 申 射 高速 独 存 中， 纽 和 行 碳 实 是 等 价 的 。 不 过 ， 在 相 联 高 如 独 丰 中， 组 和 行 是 很 不 一 样 的 ， 
ЛАЛЕ. 

Д-ДИ, Жа CUT" $a “Ж” ВЕНА. Из, FAR 4 RK $A W hiki 6 H 
“ 行 大 小 ”， 实 际 上 他 们 扒 得 是 块 大 小 ， 这 样 的 用 法 十 分 首 遍 ， 只 要 你 理解 块 和 行 之 阔 的 区 别 ， 它 不 会 
得 成 任何 误会 ， 


65 ”编写 高 速 缓存 友好 的 代码 


在 62 二 中， 我 们 介绍 了 局 部 性 的 思想 ， 而 且 人 概 地 谈 了 一 下 什么 会 具有 和民 好 的 局 部 性 。 媒 的 
我 们 已 经 明白 了 离 速 缓 存 存 悄 器 是 如 何 CERT 了， 我 们 就 能 更 如 精确 一 些 六 。 局 部 性 比较 好 的 程序 
哆 容易 有 较 低 的 不 命中 率 , 而 不 命中 率 较 低 的 程序 倾向 于 比 不 命中 率 较 高 的 程序 运行 得 更 快 。 因此 ， 
从 县 有 民 寻 有 局 部 性 的 意义 上 来 说 ， 好 的 程序 员 总 是 应 该 试 着 去 纺 写 高 速 缓 在 友好 (cache friendly) 
的 代码 。 上 直面 王 是 我 们 用 来 确保 我 们 的 代码 高 速 缓 存 友 好 的 基本 方法 : 

l. 让 最 常见 的 情况 运行 得 快 。 程序 通常 把 大 部 分 时 间 部 花 在 少量 的 核心 函数 上 ， 而 这 些 函 数 遂 
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БЕКИТІН J bB. SL. MUEREN EPER ААЖ АЫ D. ТАКАВ 
分 。 

2. 在 每 个 循环 内 部 使 逛 存 不 命中 数量 草 小 ,在 其 他 条 件 , 例如 加 载 和 存 赃 的 总 次 数 ， 相 同 的 情 
部 下， 不 命中 率 较 低 的 程序 运行 得 更 快 。 

为 了 看 看 实际 上 这 是 怎么 工作 的 ， 考 虚 6.2 节 中 的 函数 sumvec: 
int sumvecíint v[N]) 
{ 


int i, eum = Ü 


for (iz 0; i « N; 1++} 
sum «- v[i]; 
return sum; 
] 

这 个 明 数 高 速 缓存 友好 吗 ? 首先 ， 注 意 对 于 局 部 变量 i 和 sum, (МЕН ЕЕЕ Bj ДИЕ. 
买 阵 十， 国 为 它们 都 是 局 部 变量 ， 和 尾 何 合理 的 优化 编译 器 都 会 把 它们 缓存 在 寄存 器 文件 中 ， 也 就 是 
仓 情 器 后 次 结构 的 最 基层 中 。 现 在 考虑 一 下 对 向 量 v 的 步 长 为 1 ОТН. АЕА, Я АЙ 
沙 他 的 块 大 小 为 了 日 字 币 ， 那 么 一 个 步 长 为 k 的 引用 模式 〈 这 里 k 是 以 字 为 单位 的 ) 平均 每 次 循环 先 
AAH min(1，(wordsize XkYB) 次 缓存 不 命中 。 当 k=] 时 ， 它 取 最 小 值 ， 所 以 对 v 的 步 长 为 1 的 引 
用 确实 是 高 速 缓存 友好 的 。 例 如 ， 假 设 Y 是 块 对 齐 的 ， 字 为 4 个 字 节 ， 高 速 缓存 扇 为 4 个 字 ， 而 高 
速 缓存 初始 为 空 【 冷 高 速 缓 仓 )， 然 后 ， 无 论 是 什么 样 的 高 速 缓存 结构 ， 对 ， 的 引用 都 会 得 到 上 面 的 
命中 和 不 命中 模式 ， 


ces Le e pere ри рэ ырп 
онш. өйтөн [um [sw [sw [em se [ем | [um - 


在 这 个 例子 中 ， 对 v[0] 的 引用 会 不 命中 ， 而 相应 的 包含 v[0]--v[3]] h ДА dp 838 nk RS 
速 组 存 中 。 因 此 ， 接 下 来 三 个 引用 都 会 命中 。 对 v[41 的 引用 会 导致 不 命中 ， 而 一 个 新 的 块 被 加 载 到 
部 速 缓存 中 ， 接 下 来 的 三 个 引用 都 命中 ， 依 此 类 推 。 一 般 而 言 ， 四 个 引用 中 的 三 个 会 命中 ， 在 这 种 
冷 缓 存 的 情况 下 ， 这 是 我 们 所 能 获 到 的 最 好 的 情况 了 ， 
总 之 ， 我 们 简单 的 sumvee 示例 说 明了 两 个 关于 编写 高 速 缓存 友好 的 代码 的 重要 问题 ， 
. 类 局 部 变量 的 反复 引用 是 好 的 , 因为 编 诺 器 能 够 将 它们 缓存 在 寄存 器 文件 中 (时 间 局 部 性 )。 
* 步 长 为 1 的 引用 模式 是 好 的 ， 因 为 存 鱼 器 层次 结构 中 所 有 层次 上 的 缓存 都 是 将 数据 存储 为 
连续 的 欣 《 空 间 局 部 性 )， 
在 对 多 维 数组 进行 操作 的 程序 中 ， 空 间 局 部 性 尤其 重要 。 例 如 ， 考 虑 62 节 中 的 Sumarrayrows 
函数 ， 它 按照 行 优先 顺序 对 一 个 二 锥 数组 的 元 素 求 和 ; 


1 int sumarrayrowsíint a[M! [N]) 


{ 


1 
2 
3 
4 
5 
É 
1 
8 





" 
3 int i, J), sum = O; 
4 
5 


for (1 = 0: 1 < M; i++] 
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for (1-0; j < N; j++) 
Sum += aíll[3i]; 
return sun; 


w gn -—] &m 


) 

HJ CETTE EHE. А ES ФЕН Ө sumvee 一 样 好 的 步 长 为 1 的 访问 
ял. BERIAN ЗА sumvec 一 样 的 假设 。 那么 对 数组 a 的 引用 会 得 到 下 向 
的 命中 和 不 命中 模式 ， 





ЕШ ДІС “个 看 似 无 伤 大 雅 的 改变 一 一 受 换 御 环 的 次 序 ， 看 看 会 发生 什么 : 


int sumarraycolsiint alM]IN!) 
d 


int i, 1, sum = Ü; 


for (j = 0; j < N; j++! 
for {1 = 0: 1 < M; i++} 
sum += а(11(11; 
rerurmn sum; 


1 
2 
3 
4 
5 
F. 
i 
B 
3 1 


生 这 种 情况 中 ， 我 们 是 一 列 一 列 而 不 是 一 行 一 行 地 扫描 数组 的 。 如 果 我 们 够 符 运 ， 整 个 数组 部 
任 丙 速 绥 作 中， 那么 我 们 也 会 有 相同 的 不 命中 率 14. 不 过 ， 如 果 数 组 比 高 速 缓存 要 大 (更 可 能 出 
现 这 种 情况 })， 奢 么 每 次 对 ati] ili ii] AE rh! 





以 向 的 命中 率 对 运行 时 间 可 以 有 显著 的 影响 。 例 如 ， 在 我 们 的 桌面 机 器 上 ，sumarraycols 每 次 
Ada Sua] AZ] 20 个 时 钟 周期 ， 而 sumarrayrews 每 次 迭代 需要 运行 大 纲 10 F FIRE. 82, EE 
员 应 坡 注 意 他 们 程序 中 的 局 部 性 ， 试 着 编写 利用 局 部 性 的 程序 。 


ЗИ 6.14 
E š AREA FAAP, PEE e HERD ЬЯ) E — ДЕЕ Б. AE Sh bb E Ж 
看 ， 它 也 很 有 趣 ， 因 为 它 的 引用 模式 既是 以 行为 主 (row-wise】 的 ， 也 是 以 列 为 主 Ccolumn-wise ) 
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的 。 біз, ЖБК ЕЕ ЖЖ. 


typedef int axrayi2][2]; 


1 

2 

3 vold transposeliarray dst, array src) 
4 { 

5 int 1, 1; 

б 

7 For {1 = 0; i < 2; i++} Í 

B for [1 = 0; j < 2; 1++) { 

9 dst[3ili] = src[i] [3l]: 


12 ] 
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є sizeofünt) = 4. 

+ src 数组 从 地 址 位 开始，dst 数组 从 地 址 6 开始 (十 进 制 ) 

s RÄ- ALI 数据 高 速 绥 存 ， 它 是 直接 映射 的 ， 直 写 ， 写 分 配 ， 块 大 小 为 8 个 字 节 ， 

e 这 人 小 高 速 缓存 总 的 大 小 为 16 个 数据 字 节 ， 一 开 奴 是 室 的 。 

е TF src 和 dst 数组 的 访问 分 别 是 读 和 写 不 命中 的 由 一 原因 、 

A. 对 每 个 row Æ col, WART sre[row][eol] 和 dstfrow][col] 的 访问 是 命中 (hh) 还 是 不 命中 ( m). 
例如 ， 读 sre[0j[0] 会 不 命中 ， 写 dst[0][0] 也 不 命中 。 





B. 对 于 一 个 大 小 为 328383 S k 89 БАЛЫ 338. 


练习 题 6.15 

最 近 一 个 很 成 功 的 游戏 SimAquarium 的 核心 就 是 一 个 紧密 符 环 (tight loop)， 它 计算 256 个 海 
Ж (algae) 的 平均 位 置 。 在 一 台 具 有 块 大 小 为 16 字 节 (B=16)、 整 个 大 小 为 1004 宇 节 的 直接 映射 
数据 缓存 的 机 器 上 测量 它 的 高 速 钥 存 性 能 。 定 头 如 下 ; 
struct algae position { 
int X; 
int y; 


struct algae position grid[16][15]; 
int total x = 0, total y = 0; 
int i, j: 


还 有 如 下 假设 : 


1 
à 
3 
4 }; 
5 
б 
И 
8 
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+ Si2eofiint) = 4. 
а grid AL АН 0 开始 。 
. didi A NES, 
. EGARRI IS EE prid 的 元 素 的 访问 。 ЖІ. j. total. x 和 total. y 存放 在 寄存 器 
Y. 
确定 下 面 代码 的 高速 缓存 性 能 ; 
for {i = Ü; i < 15; i++) Í 
for 11-0; j < 16; j++) [Í 
total x += grid[illj].x: 
} 


1 

2 

3 

4 

5 ) 
б 

7 for (1 = Ü; i < l6; i++) Í 

Д For (j = 0; j < l6; j++} Í 

9 total y += grid[i][il.vy: 


10 } 
11 ] 


A. КЪАЖАУ 0000 
B. DRAA As p ay ЕЗДЖ Фу? | 
C. feb E & $ 9 


练习 题 6.16 
БЕ ОЖ 615 的 假设 ， 箭 定 下 到 代码 的 高 速 组 在 性 能 ; 


1 for (1 = Ü; 1 < l6; 1ї++){ 

2 tor (j = 9; j < 16; j++} { 

3 total x += grid[jllil.x: 
4 total y += srid[j)][il,y; 
5 } 

Š ) 


А. ЖЕЖ Ўр? 

B. Wik K s ри S GE $ y? 

C. 不 命中 率 是 多 少 ? 

D, 如 果 高 速 缓存 有 两 售 大 ， 那 么 不 命中 率 会 是 多 少 呢 ? 


3 3TH 6.17 

Ex 838615 的 假设 ， 确 定 下 列 代 码 的 高 速 缓 在 性 能 ， 
1 for (1 = Ü; l < 16; 1++!{ 

2 for (j = D; j < lé; j++) í 

3 total x += qrid[i][j].x; 

1 totai y += grid[illil.y; 

5 
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6 } 

А. ERESI? 

B. 高 速 独 看 不 命中 的 读 总 数 是 多 少 ? 

C. 不 命中 率 是 多 少 ? 

D. dk S dk AGE REX, RA ERES? 


66 Ғе: 高 速 缓 存 对 程序 性 能 的 影响 


本 位 通过 研究 局 速 缓 存 对 运行 在 实 际 机 器 上 的 程序 的 性 能 影响 ， 综 合 了 我 们 对 存储 器 层次 结构 
的 讨论 ， 
6.6.1 FALL (memory mountain? 

一 个 程序 从 存储 系统 中 读数 据 的 速率 被 称 为 读 吞吐 率 (read throughput)， 或 者 有 时 称 为 读 带 宽 
(read bandwidth)。 如 果 一 个 程序 在 s 秘 的 对 间 段 肉 读 个 字 节 ， 那 么 这 段 时 间 内 的 读 吞 吐 率 就 等 
于 nfs， 典 型 地 是 以 焰 字 节 每 秒 (MB/s) 为 单位 的 。 

如 果 我 们 要 编写 “个 程序 ， 它 从 一 个 紧密 程序 循环 (tight program loop) 中 发 出 ”系列 读 请 求 ， 
那么 测量 出 的 读 知 吐 率 能 让 我 们 看 到 对 于 这 个 读 序 列 来 说 的 存储 系统 的 性 能 . 图 6.40 给 出 了 on 
其 菜 个 读 序 列 吞吐 率 的 着 数 。 


code/menvmountalmountain.c 


1 void testí(int elems, int stride) /* The test function */ 

2 { 

3 int i, тевпіс = 0; 

Ë volatile int sink; 

5 

6 for {1 = 0; 1 « elems; i += stride) 

7 result += data[il; 

8 sink = result; /* So compiler doesn't optimize away the loop */ 

9 | 

10 

11  f*Runtest(elems, stride) and return read throughput (MB/s) */ 

12 double run(int size, int stride, double Mhz) 

13 | 

14 double cycles; 

15 in; elems = size / sizeofliint]; 

16 

17 test(elems, stride); /* warm up the cache */ 
18 Cycles = fcyc2(test, elems, stride, 0);  /*calltest(elems,smde) */ 
19 return (size / strice] / (cycles / Mhz); /* convert cycles to MB/s */ 
гр) 





code/menmountarm/motintaim. c 


图 6.40 测量 和 计算 读 吞 叶 率 的 应 数 
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test 请 数 通 过 以 步 长 stride 扫描 整数 数组 的 头 elems 个 元 素来 产生 该 序列 。ran ire -个 包装 
EAE Qwrapper), ЯН test 前 数 ， 共 返回 测量 出 的 读 吞 叶 率 。 第 地 行 的 如 ye2 АЖ СН ЕҢ 
Ж) 估计 了 test 函数 的 运行 时 间 , 以 CPU 周期 为 单位 ,使 用 的 是 第 9 章 中 讲述 的 次 最 优 CK-best?) 
测量 方法 ,注意 ，run 函数 的 参数 size 是 以 字 节 为 单位 的 ， 而 test 函数 对 应 的 参数 elems 是 以 字 为 单 
位 的 。 另 外 ， 注 意 第 19 行将 MBAs 计算 为 10" 字 和 节 / 秒 ， 而 不 是 2 EM. 

run ERATES] 2 size 和 stride 允许 我 们 控制 产生 出 的 读 序 列 的 局 部 性 程度 。size 的 值 越 小 ， 得 
到 的 工作 集 越 小 ,因此 时间 局 部 人 性 越 好 。stride 的 值 越 小 ， 得 到 的 空间 局 部 性 越 好 。 如 果 我 们 芭 复 
以 不 同 的 size 和 stride 值 调用 run 函数 ， 孝 么 我 们 束 能 黎 盖 读 带 宽 的 一 个 时 间 和 空间 局 部 性 的 二 
ЖА, БАЯН аз (memory mountain), É] 641 展示 了 -个 称 为 mountain 的 程序 ， 它 生成 存 
ш. 


code/mem/mountaitn/mountain. с 


1 include «<stdio.h> 

2 Kinclude "fcyc2.h" /* K-best measuremeni timing routines */ 

3 #include "cloct.h" /* routines to access the cycle counter */ 

4 

5 *üefine MINBYTES {1 << 10) /* Working set size ranges from 1 KB */ 

5 #define MAXBYTES 11 << 23) /*...upto8 МВ + 

7 define MAXSTRIDE 16 /* Strides range from 1 to 16 */ 

B tdefine MAXELEMS MAXBYTES  /sizeofiint) 

9 

10 int data[MAXELEMS ; /* The array we'll Ве traversing */ 

11 

12 int main() 

13 { 

14 int size; Ж Working set size (in bytes) */ 

15 int stride; /* Stride (in array elements) */ 

16 double Mhz; е Clock frequency */ 

17 

18 init dataidàta, MAXELEMS); f* Initialize each element in data to 1 */ 
18 Mhz = пһ?10); /* Estimate the clock frequency */ 
20 tor (size = MAXBYTES; size >= MINBYTES; size »»- 1) | 
21 tor {stride = 1; stride <= MAXSTRIDE; stride++) 
22 printf('$.1fXt", runí[size, stride, Mhz)); 

23 } 

24 printf("xn"); 

25 | 

26 ехісі0); 

2700) 





code/mem/mountain/mountain. c 


В 6.41 mountain: 一 个 生成 存储 器 山 的 程序 
mountain 程序 以 不 同 的 工作 集 大 小 和 步 长 调用 run Mg. TERMA IKB 开始 ,每 次 增加 一 
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倍 ， 最 大 值 到 WMB。 步 长 范围 为 -16， 对 于 每 个 工作 集 大 小 和 步 长 的 组 台 ，mountain ТЕН 
Vc. fX MBs. Ж 19 行 的 mhz 函数 【没有 显示 出 来 》 ье FEADAR. EANN 9 
贤 中 讲述 的 技术 ， 佑 计 CPU 时 性 频率 ， 

王 台 计算 机 都 有 惟一 的 存 入 吴山， 存储 轿 山 刻 夯 了 计算 机 的 irit ЖЕЛ. POT. BEL 5.42 f 
T Í — Intel Pentium Ш Xeon Ж [г Ж. 







iMü--——— (00——— —. Pentium Ш Xeun 
i 550 мн 
A kipu: т КВА EÍf LI d-csehe 


ES | Jë KB. 六 片上 的 LI i-cache 
512 KB 45H ED L2 3€ — 








1000 [ a 2 d 
е : 









z x LE di = _— [any 
“С x 
i Б-г ll = 
ы E 
T - m 





"s эши? 


8 542 ”存储 器 山 


这 座 Xeon ili SH EA THREE T — РЗ ЕЖЕН. ЕНГІТЖО АНЕ ш. 9 
WT ТЕЕ E LI Sedi. Ls Nx A 主 存 内 的 时 间 局 部 性 区 域 , 注意 ,LI ШЕШЕНІҢ 
E CPU ЖА 1GBAO GEFU AEEA (ЯН CPU ie 为 SOMB/ 2 [u]&fy s ulti — t 
Wm. 

LI UPAR THE Ж. 首先 ， RET M ТЕК. ERE 3 e d TE EA 
А 16KB BERI IKB ЖЖ ЕК б Cdi TE FERAS. Ж, TFT LIEBE KE I6KB. ІЛ ІШІН 
[ШЕТЕЛ ЕНЕ. 因为 L1 ВЕЕ Ө ТЕ TIER. ВЕС БЕРЕ HE I DELI 高 
ГИОАНЕ НЕ. CENH test ИЕН dedi EE ERE RES RE. E LITE. АРЕ 
{ЕЕ ЖИ. АЕНА OR ЕШШ К T FECHEE HE BER S. 

СОЗИШ E. MELENA. РИАННА, L2 上 的 制 起 
最 陡 ， 这 是 因为 当 L132 ИРАН, Ж fefe e DR Geb b RE. Ей. 即使 是 
ТЕА А, ЖЕТЕ GE L2 33 8 fret. ШЕЕ S en t. EET EHE E. |Н 
此 ， 妈 使 是 当 程 序 的 时 间 局 部 性 视差 时 ， ЗІН ЕНЕР, ЕНСЕ ТИЕ Е. 
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URRI RE 中 取出 CER. КЮРЕШ. WA 6.43, ЭЛАЗ НЕ ЗІН 
缓行 的 大 小 和 时 间 局 部 性 对 性 能 的 影响 上。 对 于 大 小 最 大 为 16KB 并 包括 16KB, TETERE 
EL) d-cache T, ЕЖ, FEER 1 GB/s 处 ， 读 都 是 由 工 1 来 服务 的 。 


1200 т-- <-- 





L2 R PE К LI ЖЕ rb Ы 


ik £ nt EMBs] 
Š 


s š K š 5 4 š š 8 š š + а 
о ш N ë r 
ТЕЖКА СҮЗ 


图 6.43 ” 存 赃 器 山中 时 间 局 部 性 的 山 着 
xdg RET j 6.42 中 stride=] 时 的 一 个 片段 。 


对 于 大小 最 大 为 256KB 并 包括 256KB， 工 作 集 完全 能 放 进 L2 统一 高 速 综 存 中 。 冉 大 的 工作 集 
土 监 就 由 主 存 米 服 务 了 。256KB 一 512KBHB 之 间 读 吞吐 率 的 下 降 很 有 趣 。 因 为 L2 EAE {т BE. 512KB, 
ОПГ КЕНЕ 512KB 处 ， 而 不 是 256KB 处 。 要 确认 的 惟一 方法 就 是 进行 一 次 详细 的 
高 速 缓存 模拟 ， 不 过 我 们 怀疑 原因 在 于 Pentium Ш 的 L2 ixi AER —- AERA. Uf 
指令 又 保 人 存 数据 。 我 们 可 能 会 看 到 的 是 L2 中 指令 和 数据 之 间 的 冲突 不 命中 的 结果 ， 它 使 得 不 能 将 
整个 数组 部 放 到 12 高 速 缓存 中 。 

以 相反 的 方向 横 切 这 座 山 ， 保 持 工作 集 大 小 不 变 ， 我 们 从 中 能 看 到 空间 局 部 性 对 读 吞 吐 率 的 凡 
WJ. 例如 , 图 6.44 ç T EREA REETAN 256KB 时 的 片段 。 这 个 片段 是 沿 着 图 642 中 的 L2 di 
切 的 ， 这 里 ， 工 作 集 完全 能 够 放 到 了 2 EAS. BUS LI 高 速 缓存 来 说 太 大 了 。 

注意 随 着 步 长 从 1 个 字 增 长 到 8 个 字 ， 读 吞吐 率 是 如 何平 稳 地 下 降 的 。 在 山 的 这 个 区 域 中 ，LIl 
中 的 读 不 命中 会 号 致 “个 换 从 L2 传送 到 L1。 取 决 于 步 长 ， 后 面 在 Ll 中 这 个 块 上 会 有 :定数 量 的 
命中 。 随 着 步 长 的 增加 ，L1 椒 命中 与 L1 命中 的 比值 也 增加 了 。 因 为 不 命中 服务 起 来 要 比 命中 慢 一 
些 ， 有 所 以 读 否 叶 率 也 下 降 了 。 一 旦 步 长 达 划 了 8 个 字 ， 在 这 个 系统 上 .8 个 学 就 等 于 块 的 人 小 了 ， 每 
个 读 请 求 在 LE 中 都 会 不 命中 ， 必 须 从 L2 服务 。 因 此 ， 对 于 步 长 至 少 为 8 个 字 的 读 生 此 率 是 一 个 党 
数 速率 ， 蚌 出 从 L2 GESORAUEHUN 11 的 速率 决定 的 。 

总 结 一 下 我 们 对 存 情 器 山 的 讨论 ， 存 储 器 系统 的 性 能 不 是 一 个 数字 就 能 描述 的 。 相 反 ， 它 是 一 
肉 时 间 和 空间 局 部 性 的 山 ， 这 座 山 的 上 升 高 度 差别 可 以 超过 一 个 数量 级 。 明 智 的 程序 员 会 试图 构造 
他 们 的 程序 ， 使 得 程 谨 运 行 在 山峰 而 不 是 低谷 。 日 标 就 是 利用 时 间 局 部 性 ， 使 得 频繁 使 用 的 字 从 1 
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"Н, ЖЕҢНІЗІНЕЕН, {## ЕНЕ ЖЕ —41 LI BRE ferr Pi АЈ]. 
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SHARE EG UH 


OOO Hum — -- | 
Еч 
== 


Uk fep] eU 





bk UE) 
Héd ТАЕНЕ (ИЖ) 
TEMERE TE 6.42 中 size 45 KB BEI — ИШ. 
Ж >Ш 6.18 
ЕЕ ЕТЕ Т k. "1-а FF| Bi ЖАНТ 
时 间 局 部 性 ? Bis? 哪个 四 对 应 于 


Ж 6.19 

| ТЕХН Д, шана Е Ho S pH a) t iw LE дір ТЕҢ. 
маманына Tieu кан-и МИИ, o CPU MNA 

{Ё Е 

А. ЕЗ А EU LI d-cache. 

B. ЖЕ ЕМІ ЖА. 

C. Ё Ф, 

TURAE СТАА 16м, ЖЕ-ІБ) 时 ， ib &ot $ 3) BÜMBIS, 


5.62 重新 排列 循环 以 提高 空间 局 部 性 
Ж Маха РЕ Ж ЕЕ; С= AB. Bán, Ed ла 2, 2 


P - Js йз | [Bi by 
Cp Сп lan ар | | bx 


Си = аб + йй 
сіз = dydy ayby 


А! 
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Cu = аури + dab 


с» = аур + ah, 


ЖЕНА ЖОЙ НӨ ER] = ICE BR ЖИЫП. RUE SE ES 1. ук 来 标识 。 如 果 我 
们 改变 御 环 的 次 序 ， 对 代码 进行 … 些 其 他 的 小 改动 ， 我 们 就 能 得 到 处 阵 乘法 的 六 个 在 功能 工 等 价 的 
ЖА, ШИЕ 6.45 所 示 。 每 个 版 本 部 以 它 循环 的 顺序 来 惟一 地 标识 。 t 


code/mem/matmult/mm.c 
1 for іі = Ü; 1 < n; 1++) 
2 for (j = 0; j < n; 1-+) Í 
3 sum = 0,0;, 
4 lor [k = 0; k < n; K++) 
5 sum += A[i][k]*B[k][j]; 
Я C[il[j] += sum; 
i 


cede/meum/matmult/imm.c 


(a) ЖЖЖ 


code/mem/matmyWlt/min.c 


1 for (j = Ü;: jJ < n; je) 
2 for ti = Ü; l < n; i++) í 
3 sum = 0.0; 
4 for ik = 0; k < n; k++) 
5 sum += A[il[k])*BIK] [j]; 
$ Clil[j] += sum; 
7 } 
code/mem/matmult/mm.c 
(b) ДЕ RE 
—- code/mem/matmulymm.c 
1 for (j = Ü; j} < n; j++] 
2 tor [k = Ü; k < n; k++) Í 
3 г = B[k] [J]; 
4 fcr {i = 0 1 < n; i++} 
2 C[ill3l += А[1}[К]*г; 
6 ) 
code/menvmatmult/mm.c 
(сынама 
code/Amem/matmult/mm.c 
1 tor (k = Ü; K < n; k++} 
2 for (j = 0; с < n; ]++) Í 
3 r = B[k][ji]; 
4 Гог (i = 0; i < n; i++ 
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2 СПІІГ2І += A[il[k]*r; 


code/menvmaimuli/mm.c 
( d) kii IR 


code/mem/matmult/mm. c 
for (k = 0; k < n; k++) 
for ii = Q; i < n; 1++} d 
r = Alil][k!): 
for (j) = D; jJ < n; j++} 
С{1]{1] += r*B(kl [3]; 


Gn іл наш DB PF 


code/mem/matmult/mm.c 
(e) ku c 


code/mem/matmult/mm.c 


1 tor (i = 0; i < n; l++] 
2 for (k = 0; k < n; k++} { 
3 r = A[i][k]; 
4 tor (j- Ú; j < n; j++) 
5 С[1][3] += r*BIKk: ІЗІ; 
6 } 
code/mem/matmult/mm.c 
(f ) ik; E 


Bi 6.45 起 阵 乘法 的 六 个 版 本 


在 高 层 来 看 ， 这 六 个 版 本 是 非常 相似 的 。 如 果 加 法 是 可 结合 的 ， 那 么 每 个 版 本 计算 出 的 结果 完 
е-Н 5 每 个 版 本 总 共 都 执行 Dtn9) 个 操作 ， 而 加 法 和 乘法 的 数量 相同 。A 和 B 的 双全 元 素 中 的 每 
—^4 882 n 次 。 计 算 C 的 全 个 元 素 中 的 每 一 个 都 要 对 个 值 求 和 。 不 过 ， 如 果 我 们 分 析 最 里 层 循 
环 选 代 的 行为 ， 我 们 发 现在 访问 数量 和 局 部 性 上 还 是 有 区 别 的 。 为 了 这 次 分 析 的 目的 ， 我 们 杖 了 如 
Fd: 

. 每 个 数组 都 是 一 个 double 类 型 的 nxn Н. sizeof(double) = 8. 

€ 只 有 一 个 高 速 缓存 ， 其 块 大 小 为 32 字 节 《〈B = 32)。 

e 数组 大 小 n 雏 大 ， 以 至 于 矩阵 的 一 行 都 不 能 完全 装 进 1 高 速 缓存 中 。 

* 编译 器 将 局 部 变量 存储 到 寄存 器 中 ， 因 此 循环 肉 对 局 部 变量 的 引用 不 需要 任何 加 载 或 存储 

指令 。 

646 刀 结 了 我 们 对 征 环 的 分 析 结 果 。 注 意 六 个 版 本 成 对 地 形成 了 三 个 等 价 类 ， 用 最 内 层 循环 
中 访问 的 矩阵 对 来 表示 每 个 类 。 例 如 ， 版 本 证 和 证 是 类 AB 的 成 员 ， 因 为 它们 在 最 内 屋 的 循环 中 
引用 的 是 矩阵 A 和 B (而 不 是 C)。 对 于 每 个 类 ， 我 们 统计 了 每 个 内 层 循环 克 代 中 加 载 〔〈 读 ) 和 在 


2 正如 我 们 在 第 2 章 中 学 到 的 ， 泽 点 加 法 是 可 交换 的 ， 但 是 通常 不 是 可 结合 的 。 实际 上 ， 妆 果 矩 阵 不 把 极 大 的 数 和 极 小 的 数 
课 在 一 起 一 一 存 情 物 理 风 性 的 短 阵 常常 这 样 ， 那 么 息 设 浮 点 加 法 是 可 缚 合 的 也 是 合理 的 。 
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Ш CHO HAE, ЖКХ ИЗАТ А, B 和 C ОЛЕ Eki РАТЕ, DURSEDORTO 
Fr i ЧЕ et 

Ж AB 例 程 的 里 层 循环 {图 6.45 (а? 和 (b) ] 以 步 长 1 扫描 数组 A f ir. ЇЛГЇ DER ER 
保存 四 个 双 学 ， 的 不 命中 率 是 每 次 达 代 不 命中 025 次 。 另 一 方面 , 里 屋 循环 以 步 长 n 扫描 数组 B 
0—71. BEA n 很 人 ， 每 次 对 数组 B 的 态 问 都 会 个 命中 ， 所 以 每 次 达 代 总 共 会 有 125 次 不 命中 。 


“Ж КАЕ та FAR |АЛ@ ША | 日 不 命中 每 次 | Ста | 总 不 合 中 每 次 
本 GR) 选 代 使 用 的 | 选民 使 用 的 | AREAN ЕНЕ 选 代 使 用 的 ARERR 


y 
ijk & jik (AB) 2 0,25 1.00 0,00 1,25 
Jki & БГ (AC) 2 1.00 0.00 1.00 2.00 
kij & ikj (RC) 2 0.00 0.25 0.25 0.50 


В 646 年 阵 乘法 里 层 循环 的 分 析 
六 个 版 本 分 为 一 个 等 价 娄 ， 以 于 层 循环 中 访问 的 教 组 对 来 喜 汞 。 










类 AC 例 程 的 里 层 循环 | 图 645 (с) 和 (d) TR h], RK BUT PAP KC ЕН 
(相对 于 类 AB 例 程 ， 它 们 执行 2 个 吉 载 而 没有 存储 )。 第 一 ,里 层 循 环 以 步 长 mn 扫描 A 和 CC КУ, 
结 琳 古 每 次 加 载 都 会 不 命中 ， 所 以 每 次 达 代 总 共有 了 丙 个 不 命中 。 注 意 ， 与 类 АВ 例 程 相 比 ， 交 换 特 
环 降低 了 空间 局 部 性 。 

BC PIR(BI 6.45 (e) 30 CO ] 展 示 了 一 个 很 有 趣 的 折 中 ， 使 用 了 两 个 加 载 和 … 个 存储 ， 它 们 楷 
АВ 例 竹 多 南 要 -个 存储 器 操作 。 男 一 方面 ， 因 为 里 层 循 环 以 步 长 1 访问 模式 扫描 B Ri C К], 每 
次 选 代 每 个 数组 上 的 不 命中 讼 只 有 035 次 不 命中 ， 所 以 每 次 选 代 总 共有 总 50 个 不 命中 ， 

图 6.47 小 结 了 一 个 Pentium III Xeon 系统 土 托 阵 滋 法 各 个 版 本 的 性 能 。 这 个 图 辕 出 了 每 次 里 层 
TERRA CBS ЕН РЕ) CPU 周期 数 作为 数组 人 小 Сп) 的 消 数 ， 
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ЖАЖА (2) 


6.47 Pentium Ill Xeon 矩阵 乘法 性 能 
НІНІ: b Ris ЖАС; иШ: ЖС; gk A jik: 35 AB. 
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对 于 这 幅 图 有 很 多 有 意思 的 地 方 值得 注意 ， 

. 对 于 大 的 n 值 ， 即 使 每 个 版 本 都 执行 相同 数量 的 笃 点 算术 操作 ， 最 快 的 版 本 比 最 旬 的 版 本 
运行 得 快 二 倍 。 

н 存储 器 访问 数量 和 局 部 性 者 相同 的 版 本 ， 有 大 致 相同 的 测量 性 能 。 

. 仔 储 性 能 最 糖 糕 的 两 个 版 本 ， 就 每 次 迭代 的 访问 数量 和 不 命中 数量 而 言 ， 明 显 地 比 其 他 四 
个 版 本 运行 得 惕 ， 其 他 四 个 版 本 有 较 少 的 木 命 中 次 数 或 者 较 少 的 访问 次 数 , 或 者 兼 而 有 之 。 

АВ 例 程 一 一 每 次 迭代 有 2 个 存储 器 访问 和 125 次 不 命中 一 一 在 这 种 机 器 上 运行 得 比 类 
BC 例 程 一 -每 次 迭代 3 个 存储 器 访问 和 0.5 次 不 命中 一 一 要 好 一 点 ， 后 者 用 一 个 额外 的 存 
储 器 访问 来 换取 较 低 的 不 命中 率 。 村 点 就 是 对 于 性 能 来 说 ， 离 速 缓存 不 命中 率 并 不 是 问题 
的 全 部 。 存 储 器 访问 的 数量 也 很 重要 ， 而 且 在 许多 情况 中 ， 找 到 最 好 的 性 能 就 是 雪 在 这 两 
i zum. 4218 632 和 6.33 更 深入 地 论述 了 这 个 问题 ， 


6.6.3 使 用 分 块 来 提高 时 间 局 部 性 

企 二 一 节 中 ， 我 们 看 到 一 些 很 简单 的 循环 重新 排列 是 如 何 能 够 提高 空间 局 部 性 的 。 但 是 我 们 也 
看 到 ， 即 使 使 用 很 好 的 循环 拉 套 ， 每 次 和 钳 环 选 代 的 时 间 都 短 着 数组 大 小 的 增长 而 增长 。 发 生 的 事情 
是 这 样 的 ， 当 数组 大 小 增加 时 ， 时 间 局 部 性 降低 了 ， 而 高 速 缓 存 中 容量 不 命中 的 数目 增加 了 。 为 了 
改正 这 个 问题 ， 我 们 使 用 了 一 种 普通 的 称 为 分 块 (blocking) 的 技术 。 不 过 我 们 必须 指出 ， 与 那些 
为 了 提高 空间 局 部 性 的 简单 循环 变换 不 同 ， 分 块 使 得 代码 更 难 阅读 和 理解 。 因 此 ， 它 最 适合 于 优化 
编译 器 或 者 频繁 执行 的 库 例 程 。 不 过 学 习 和 理解 这 项 技术 仍然 是 很 有 趣 的 ， 因 为 它 是 -个 能 圳 产生 
已 大 性 能 收益 的 很 普通 的 概念 。 

分 块 的 大 致 思想 是 将 一 个 程序 中 的 数据 结构 组 织 成 称 为 块 (block) 的 组 块 《chunks)。( 在 这 个 
上 下 文中 ,“ 据 ” 指 得 是 一 个 应 用 级 的 数据 给 块 ， 而 不 是 高 速 缓存 块 。) 这 样 构 造 程序 ， 使 得 能 够 将 
一 个 块 加 载 到 L1 高速 缓存 中 ， 并 在 这 个 块 中 进行 所 需 的 所 有 的 污 和 写 ， 然 后 丢掉 这 个 央 ， 加 载 下 
“А, КЕ. 

ЛЕЕ RA ERAR ET REPE ECT ABER, REAA н ВЕ 
矩阵 这 个 数学 依据 。 例 如 ， 如 果 n =8， 那 么 我 们 可 以 将 每 个 矩阵 划分 成 四 个 4x4 Е. 


Ë «| 4% HIM | 
Cal ©» Ал А» | |В, By 


Cu = Аби t+ Anba 
Co = АнВо%АуВ; 
Сы = ApBut Anba 
С» = Anit Anbo 
图 6.48 展示 了 矩阵 乘法 的 一 个 分 块 版 本 ， 我 们 称 之 为 bijk 版 本 。 这 段 代 码 背 后 的 基本 思想 是 将 
АЯС 划分 成 1 x bsize 的 行 条 (Crow slivers), 38 B 划分 成 bsize x bsize 的 块 。 最 内 层 的 〈《j，k) fü 
环 对 用 B f TRER A 的 一 个 行 条 ， 将 结果 放 到 C 的 一 个 行 条 中 。 用 B 中 同一 个 块 ，i КЕ 
АЧ АЯС 的 sn МТЖ. 
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— code/merm/matmuli/bmm.c 
1 void Біјк(ахгау А, array B, array C, int n, int bsize) 
А { 

3 int i. 1. k, kk, jj; 

4 double виш; 

5 int еп = bsize * í(n/bsize); /* Amount that fits evenly into blocks */ 
5 

7 for ii = Ü; i < n; i++} 

8 For (j = O; j < n; j++} 

g Cfilli] = 0.0; 

10 

11 for (kk = 0; kk < en; kk += bsize} 1 

12 for (jj = 0; jj < en; jj += bsize) 1 

13 for {1 = Ü; i < n; 1++) Í 

14 ior (J = Jj; j < 3j + bsize; j++) í 
15 sum = Clilljl: 

16 for {К = kk; k < kk + bsize; k++} 1 
17 sum += A[i][k]*BIk] [2]: 

18 1 

19 С[1][1] = sum; 

20 } 

21 ) 

22 } 

23 } 

24 } 


code/men/mamultfbmm,c 


图 6.48 ЖЕ А 
ЖР ЛЕ k ҖЕН ҚА (п) ЖҚА Әріге) 的 整数 倍 ， 


图 649 给 出 了 图 648 中 分 块 代码 的 一 个 图 形 化 的 说 明 。 关 键 思想 是 它 加 载 B ERE E 
缓存 中 ， 使 用 它 ， 然 后 南开 它 。 对 A 的 引用 有 很 好 的 空间 局 部 性 ， 因 为 是 以 步 长 1 来 沪 问 每 个 行 条 
的 。 它 也 有 很 好 的 空间 局 部 性 ， 因 为 是 连续 bsize 次 引用 整个 行 条 的 。 对 B 的 引用 有 好 的 时 间 局 部 
fk. [NOM OE SE n 次 访问 整个 bsize x bsize 块 的 。 最 后 ， 对 忆 的 引用 有 好 的 空间 局 部 性 ， 因 为 行 条 
的 每 个 元 素 是 连续 写 的。 注意 对 CC 的 引用 没有 好 的 时 间 局 部 性 ， 央 为 每 个 行 条 都 只 被 访问 一 次 。 








kk | 
= 
kk bsiza 
B 
bsize 次 局 用 LX bsize $T # 连续 n tE FH 更 新 1 X bsize 
bsize X Бубе 的 块 fr fpes m m Ж 


图 6.49 分 块 的 矩阵 乘法 的 图 形 化 说 明 
最 内 层 的 GA IHH B 的 一 个 bszeX byize ARER A J 一 个 1x bsize ТЖ. 将 结果 前 到 C 的 一 个 ] x byize 的 行 条 中 。 


_——— s. CL n H 


кё Еи КЫН ан анн ЖАНЕ (baize = BN 注意 ， ТҮТІП ТІПТІ 
жи Г p 8. AEREA 加 个 周期 改进 到 每 次 千代 大 的 加 个 周期 ， 另 一 件 甘于 分 块 的 有 趣 
虽 情 是 十 看 整 诅 大 小 的 增长 ， 每 沁 造 代 的 时 间 几 乎 保持 焉 变 ， 对 于 小 的 数 诅 大 小 ， 分 块 版 本 中 的 者 
外 开销 恒 得 它 比 非 分 块 版 本 运行 得 还 要 慢 ， 在 大 的 mm100 处 有 一 个 变 及 点 ， 在 此 之 后 分 块 版 本 就 运 
терт. 


ЯН. URS ÜRROH NOE T. fE fodit 
МЕЛАНИН ТИВЕН АЕ ДАВАТЕ. 在 这 些 应 用 *, РҮ КЫ ЕШ 
ubi A. Wank d E ERR 12%) HAMA, Sac i, 处 理 它 
їй, BELEH- trie RA dl: POSU. | 
ABRE ned S яһаған (streaming media ) 工作 和 RE жт РРР 
Ah). АА E AUR ГҮЛГӨ АОБ ФЕН E PERRA, Ti, Ayka 
AUR c т ВЕ, Mors ri cgi УЗАТ | 
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Ш 650 Pentium И Xeon 上 分 快 的 王 阵 二 法 性 能 
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446 $6* 


67 жа. 利用 程序 中 的 局 部 性 


正如 我 们 看 到 的 ， 存 储 系 统 琉 组 织 成 一 个 存储 设备 的 层次 结构 ， 较 小 、 较 快 的 设备 咎 近 顶 部 ， 
较 大 、 较 慢 的 设备 党 近 底 部。 由 于 这 种 层次 结构 ， 程 厅 访 问 存 储 位 置 的 有 效 速率 个 是 一 个 数学 能 措 
Ж. НЫ, 它 是 一 个 变化 入 大 的 程序 启 部 性 的 函数 《我 们 称 之 为 存 储 器 山 )， 变 化 可 以 有 几 个 数量 
级 。 有 良好 局 帮 性 的 程序 从 快速 L1 A L? БАИ АТАЛ Б ЕН ХОК. АЙМЕН ЕН: 
从 相对 慢 速 的 DRAM 主 企 中 访问 它 的 大 部 分 数据 ， 
理解 存储 嚣 居 次 结构 本 质 的 程序 员 能 够 利用 这 些 知 识 ， 纲 与 出 更 有 北 的 程序 ， 无 洛 兵 体 的 行 依 
系统 结构 是 怎样 的 。 特 别 地 ， 我 们 推荐 下 列 技 术 : 
. 将 你 的 注意 力 集中 在 内 邵 循环 上 ， 大 部 分 计算 和 存 铺 器 访问 部 发 生 芷 这 里 。 
е 通过 按照 数据 对 象 存储 在 存储 器 中 的 顺序 来 读数 据 ,从 而 使 得 你 程序 中 的 空间 局 部 性 最 大 。 
ç 一旦 从 存储 器 中 读 入 了 个 数据 对 象 ， 就 尽 可 能 多 地 使 用 它 ， 从 而 使 得 你 程序 中 的 时 间 同 
部 性 最 六 。 
. 也 住 ， 不 市 中 率 只 是 确定 你 代 公 性 能 的 一 个 因素 【虽然 是 重要 的 )。 存 储 器 访问 孝 量 也 扮 洗 
者 重要 角色 ， 有 有 时 需要 在 两 者 之 间 做 一 下 折 中 。 


6.8 小 结 


基本 存储 技术 包括 ВАМ EIERN ROM ( 非 易 失 性 存储 器 ) 和 磁盘 。RAM 有 两 种 基本 
AH. SRAM (静态 RAM) 0—6, SEERE, ERa GHE CPU 芯片 上 的 高 速 缓存 ， 也 可 
M HAUGAR REAT. А RAM (DRAM) 慢 一 点 ， 也 人 穗 宜 一 些 ， 用 散 主 存 和 图 形 帧 缓冲 区 ， 
非 易 失 性 存储 器 ， 也 称 为 只 读 存 储 器 〈ROM)， 即 司 是 在 关 电 的 时 候 ， 也 能 保持 它们 的 信息 ， 宅 人 
用 来 存储 本 忻 ‘firmware )。 磁 盘 是 非 易 失 性 存储 设备 ， 以 每 个 位 很 低 的 成 本 保存 大 量 的 数据 ， 代 价 
是 较 长 的 访问 时 间 。 

一 般 币 寺 ， 较 快 的 存储 技术 每 个 位 会 更 贵 ， 而 及 容量 较 小 。 这 些 技术 的 价格 和 性 能 属性 正在 动 
态 地 以 不 同 的 速度 变化 着 。 特别 地 ，DRAM 和 磁盘 访问 时 间 淮 后 于 CPU 周期 时 间 。 系 统 通过 将 存 
屠 器 组 织 成 存 侍 设备 的 层次 结构 来 弥补 这 些 差 异 ， 在 这 个 层次 结构 中 ， 较 八 、 较 快 的 设备 在 顶部 ， 
较 大 、 较 慢 的 设备 在 底部 。 因 为 编写 良好 的 程序 有 好 的 局 部 性 ， 大 多 数 孝 据 都 可 以 从 较 高 屋 ”得 到 
服务 ， 结 果 就 是 存储 系统 能 以 较 高 层 的 速度 运行 ， 但 赴 有 较 低 层 的 成 本 和 容量 。 

程序 员 可 以 通过 编写 有 和 良好 空间 和 时 间 局 部 性 的 程序 来 战 态 地 改进 程序 的 运行 时 间 。 利 用 基 十 
SRAM МЕЛ ЕЕЕ, TEM L 高 速 缓存 取 数 据 的 程序 能 比 主要 从 存储 器 取 数 据 的 
程序 运行 得 快 过 一 个 数量 级 ， 
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КЕДЕ tR УШНА ЕКЕН. Daka S MEB Е i RI RUE D FRE AC 
ІМ, RU ELSE APIS АЯМА. ЖАҢ, in Eden ЈИЕ А, ЯҒ 
磁道 的 位 数 就 会 载 大 ， 但 是 总 的 磁道 数 会 减少 。 如 果 用 reden RIEEPER, xr ЙЫ, 
那么 x 取 什么 值 能 使 这 个 磁盘 的 容量 最 大 ? 

621 € 

КЕНІ - 些 不 同 的 高 速 缓存 的 参数 。 确 定 每 个 高 速 缓存 的 高 速 缓存 组 数量 GO. Ed 
М CO. 519 (s) 以 及 块 偏 物 位 数 (b), 





622% 
这 个 问题 是 关于 练习 题 69 rh Bj W SE {РТ 


448 Pot 


A， 列 出 所 有 会 在 组 1 中 命中 的 十 六 进 制 存 储 嚣 地址 ， 
B， 列 出 所 有 会 在 组 6 中 命中 的 十 六 进 制 存 储 器 地 址 。 


623 %% 
25 RE КИНЕ E р: 


typedef int array|4] [4]; 


1 

2 

3 void transpose2(array dst, array src) 
4 | 

5 int i, 3; 
5 

8 

9 


for [1 = ©; 1 < $; i++) Í 
for (j = 0; j < 4; j++} f 
dst [j [i] = src[il]ljl; 
10 } 
-1 ) 
13 } 
假设 这 段 代码 运行 在 一 台 上 县 有 如 下 属性 的 机 器 上 : 
е  sizeaf(int) = 4. 
. 数组 src 从 出 址 如 开始 ， 而 数组 dst АЛШ 64 开始 《十 进 制 )。 
. ”内 有 … 个 LL1 数据 高 速 组 存 ， 它 是 自 接 映射 、 直 写 、 写 分 本 的 ， 抉 大 小 为 16755. 
. 这 个 贞 速 库存 总 共有 32 ЖЕТІ. MAAT. 
. 对 sic 和 dst 数组 的 访问 分 别 是 惟 “的 读 和 写 不 命中 的 来 源 。 
对 十 每 个 row 和 col， 指明 对 sre[row]j[celj 和 dst[row][col] 的 访问 是 命中 (hb) 还 是 不 命中 Om. 
SAn, i src[0]{0] 会 不 命中 ， 而 写 dst[0]I0] 也 会 不 命中 。 


dst 数组 
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624 4% 
对 于 一 个 总 大 小 为 128 数据 字 节 的 高 速 组 存 ， 重 复 练 习题 623. 


C DI» [зү [з 
керү ү ү 
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3M ЖЕН ЕН ЖЛ. ЖОЛМЕН. ICT IDEE. fuimus ED et ART АП CMYK 
ORG, Яла. ЖЕ, ЖЕ) fl. 3M 雇佣 你 判定 下 面 算法 在 一 个 2048 字 节 、 直 接 映射 、 块 大 小 为 
32 学 节 的 数据 高 速 缓存 上 的 有 效 性 。 有 如 下 定义 : 


1 struct point color { 

2 int с; 

3 int m; 

4 int y; 

5 int k; 

5 1; 

? 

8 struct point color square[161116]; 
9 int i, 3; 

НИ ЫЙ: 


в. sizeof(int) == 
° square 起 始 于 存储 器 地 址 0. 
* IESS FJ 25. 
a 惟一 的 存储 器 访问 是 对 于 square 数组 中 的 元 素 。 变 量 1 和 j 被 存放 在 寄存 器 中 。 
确定 下 列 代码 的 高 速 缓存 性 能 : 
1 For (iz б; i < 15; I++ii 
For ij = 0; j) < 165; del í 
square[ilft3].c = 0; 


ы Ку 
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4 scuarc[i [jl.m = 0; 
5 square[i.[j].v = 1; 
6 squareíi.;31.k = 0; 
з 

8 } 

А, Gs TUE Р? _ 

B， 看 高速 缓存 中 不 命中 的 当 总 数 是 多少 ? 
С. тт ЖАДА £ b? 

626 € 


给 定 练 习题 6.25 ТЕЛЕ, {йл PARER REF TE ВЕ: 
1 tor li = Ü; іс i5; 1++) { 

2 fcr (j = D; j < 15; j++) { 
3 square[j][il.e = С; 

4 saquare[jl[il.m = ё; 

5 equare[2]lil].y = 1; 

6 &quare[-][i].k = 0; 

, 

B 


] 

A. GREG bo EM 

B. атлеты нь) 0 
C. Tft Ë. pp? 


627 Фф 
ЖАН 6.25 Т ИЕ, Doe РИНО ЕТТЕ ЯЕ: 
1 for (1 = б; l< l6; i++) 1 
2 tor {р = Ü: | < 15; j++) Í 
3 aquarciil]lkljl.y = 1; 
1 ! 
3 ) 
6 for {1 = D; 1 < 15; i++] Í 
7 [от (] = Ü; J < 16; j++) d 
B aquare[ij[J3..c = Ü; 
9 &quare[illjl.m = ü; 
10 square[i][jl.k = D; 
] ] 
12 1 


A. 与 总 数 是 多 少 ? 
В.Н АЛЫН ЗМНАНД%Ф? 
C. Канар? 
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628 ФФ 

你 正在 编写 一 个 新 的 3D ЙЫЯ, ЖЕБЕЛІ. ВЕТРЕ У ЮЙ. Emr- Wei 
清空 屏幕 缓冲 区 ,你 现在 工作 的 屏幕 是 640X480 像素 数组 的 。 你 工作 的 机 器 有 一 个 64KB 直接 映射 
高 速 缓 存 ， 每 行 4 个 字 节 。 你 使 用 的 C 数据 结构 为 ; 

1 struct pixel { 
char т; 
char g; 
char b; 


char a; 
y 


Struct pixel bufferi48Q0] [640]; 
int i, d; 

Ü char *cptr; 

1 int *iptr; 


ҥе e о с ы Cn їл e LQ К 


Ви КЕ: 

e sizeof(char)--1 和 sizeof(int)2-4. 

° buffer 起 始 于 存 情 器 地 址 ， 

. ARRETRATE. 

. TES TRET EXIT. buffer 数组 中 的 元 素 ， 释 量 1、j、cptr 和 iptr ТЛ ТАРЫН. 
下 面 代 色 中 下 分 之 多 少 的 写 会 在 高 速 缓存 中 不 命中 ? 

1 tor ij = O; j < 640; j++) 1 


2 for ti = 0; i < 480; i++) Í 

3 buffer[i][3].r = 0; 

4 butffer[illjil,g = 0; 

5 buffer[il[3].b = 0; 

5 buffer[il][ljl.a = 0; 

, 

H ] 

6.29 €€ 

给 定 练习 题 6.28 中 的 假设 ， 下 面 代码 中 百 分 之 多 少 的 写 会 在 高 速 缓存 中 不 命 握 ? 
1 char *сріг = {char *) buffer; 

2 Гог |; cptr < (((cnar *) buffer) + 640 * 480 * 41; cptr++} 
i *cptr = 0; 

6.30 ФФ 

给 定 练习 题 6.28 中 的 假设 ， 下 面 代码 中 百 分 之 多 少 的 写 会 在 高 速 缓存 中 不 命中 ? 
1 int *iptr = (int *)buffer; 

2 tor (; iptr < (iint *jbuffer + 640%4801; iptr++) 

3 *iptr - 0; 

631 9499€ 


从 CS:APP 的 网 站 上 下 载 mountain UT, fk CREEK PCLinux. 系统 土 运行 它 。 根 据 结果 个 
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计 你 系统 上 L] 和 L2 高 速 缓存 的 大 小 。 


632 Ф444 

开 这 项 什 务 中 ， 你 会 把 你 在 第 5 章 和 第 6 童 中 学 习 到 的 概念 应 用 到 一 个 存储 器 使 用 频繁 的 应 用 
的 代码 优化 问题 上 。 考 起 一 个 拷贝 并 转 置 一 个 类 卉 为 int МХМ 和 矩阵 的 过 程 。 也 就 是 ， 对 于 源 甜 阵 
S FILIRURHEE D, RAT] RESET ZU SS s, $5018) 由 ,。 只 用 一 个 简单 的 循环 就 能 实现 这 段 代码， 

1 void transposeí[int *dst, int *src, int dim) 
| 

int i, 1; 


[ог [i = C; 1 < dim; із) 
for (j) = 0; J < dim; j++} 
dst[j*dim + i] = src[:*dim + j]; 


пс — С Doa ім Мм) 


| 


XU, TENES a|] Н КЖ (dst) AREE (өс) ҰНЫН, ДАЖЕ КАУ М Сат). 
要 想 使 得 这 自 代 码 运 行 得 快 ， 需 要 两 种 优化 。 首 先 ， 明 然 函 数 在 利用 源 牛 阵 匆 空间 局 部 性 L iwan 
Я, HECHA N ARRERA. E, ОСС 产生 的 民 码 不 是 非常 有 效率 。 看 看 汗 
SUUS. RATEN DIRE EHE 10 条 指令 ， 其 中 有 5 小 会 引用 存储 器 一 一 -个 引用 源 矩 阵 ， 一 个 
引用 日 的 全 阵 ， 而 三 个 从 栈 中 读 局 部 变量 。 你 的 工作 就 是 解决 这 些 问题 ， 设 计 一 个 运行 得 尽 可 能 快 
RH RAX., 
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这 项 作业 是 练习 题 632 的 ”个 有 趣 的 变 体 ,考虑 将 一 个 有 向 图 g 转换 成 它 对 应 的 无 向 图 g'。 图 
ҮН ЖАШ u SA, "T BOR g dUB- -条 日 到 v 或 者 v 到 u 的 边 。 Шо 是 出 如 下 
的 它 的 邻接 短 阵 〈adjacency matrix) G 表示 的 。 加 果 N 是 g 中 顶点 的 数量 ， 那 么 G 是 一 个 NXN 的 
Ж, ЕСЕ 0 或 者 全 1. 假设 g ЕЛАНА MAR: vove vui WAWES M +, 
到 Yi 的 这 ， 那 么 G 身 四 为 1， 否则 为 0。 注 意 ， 邻 接 咎 阵 对 角 线 上 的 元 来 总 是 1， 市 尤 疝 疼 的 邻接 捧 
阵 是 对 称 的 。 只 用 … 个 简单 的 循 坏 就 能 实现 这 段 代码 ， 

1 void col convert(int *G, int dim) í 
int i, 1; 


for {1 = G; i < dim; ise! 
for |j = 0; i < dim; j++) 
G[j*dim + i] = G[j*dim + i] || G[i*dim + 311; 


— c Ln 6 Шы D 


) 
TRES L TEE CHE МАТА ТЕН. [АВГА M Hes. SERE MT ИЕ. MEEN 
你 在 第 5 章 和 第 6 章 中 所 学 到 的 概念 。 


练习 题 答案 
练习 是 6.1 答案 
这 里 的 思想 是 通过 第 纵横 比 max(r,cymintrc) 最 小 ， 使 得 地 址 位 数 最 小 。 换 血 话 说 ， 数 组 越 接 近 
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于 正方 形 ， 地 址 位 数 越 少 ， 









max(b, B) | 


eel ГҮ ҮТ 
sss | i | s]| 4 | 3 | a | 
sa [ири G T al s 

1024 x 4 
练习 题 0.2 管 案 


这 个 小 练习 的 主 则 是 确保 你 理解 柱 面 和 磁道 之 间 的 关系 。 一 旦 你 弄 明 和 白 了 这 个 关系 ， 那 问题 就 
很 简单 了 : 






Dak _ Sllbytes 400 sectors 10006 racks lsurfjaces — 2platters 
capacity — sector X "rack surface X "platte X disk 
= 8192000000bytes 
= 8.92GB 


练习 题 6.3 答案 
对 这 个 问题 的 解答 是 对 磁盘 访问 时 间 公 式 的 直接 应 用 。 平 均 旋 转 时 间 《以 ms 为 单位 》 为 
Tog roaion 一 1/2 x T mar rotation 


= 1/2 x (60 secs/15 000 RPM )x1000 ms/sec 
2 ms 


i 


平均 传送 时 闻 为 
Tovg manse = 6(O0secs/15 000 RPM) x1/500 sectors track х1 000 ms/sec 
= 0.008 ms 
伙 地 来 该 ， 总 的 预计 访问 时 间 为 


Taccess = Tug seek 十 Ig rotation 十 Lug itansfer 
8 ms + 2 ms + 0.008 ms 


= ]Ü my 


练习 题 6.4 答案 
为 了 创建 一 个 步 长 为 1 的 引用 模式 ， 必 须 改 变 循环 的 次 序 ， 使 得 最 右边 的 索引 变化 得 最 快 : 


1 int sumarray3d(int a[NI[NI[N]! 
2 { 

3 int i, J, K, sum = 0; 

4 

5 


for (k = D; k < N; K++I í 
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6 for (1 = Ü; i < Nr: i++} Í 

7 for (5 = U; J < N; j++) í 
8 sum += alkl[il[j}; 

9 } 

10 } 

11 } 

12 return sun; 

13 ] 


x — BES J АВ, ERRER 了 为 什么 这 种 循环 次 序 改 变 就 能 得 到 一 个 步 长 为 | ПИЛ 
lu f. 

练习 题 6.5 9% 

Ж ux E tT ER ЫЙ E er Ет ЕДЕН НЕП. S5 ИЙАН НД. ИАЖ clearl 
以 步 长 为 1 的 引用 模式 访问 数 给 ， 因 此 明显 地 具有 最 好 的 空间 局 部 性 。 孙 数 clear2 依次 扫描 N 个 结 
构 中 的 每 一 个 ， 这 是 好 的 ， 但 是 在 每 个 结构 中 ， 它 以 步 长 不 为 1 fo ESI PSUEDS T E Je ha ly 
MEER: 0, 12. 4. 16. 8.20. ЖИ clear2 的 空间 局 部 性 比 clearl BER. 94 Ж clear3 DUE 
每 个 结构 中 跳 来 跷 去 , 而 日 还 从 结构 跳 到 结构 ， 所 以 clear3 的 空间 局 部 性 比 clear2 和 clearl #8925, 


练习 题 6.6 管 案 
这 个 解答 是 尘 图 626 中 各 种 高 速 缓 他 参数 定义 的 直接 应 用 。 不 都 么 令 人 兴 背 ,但 是 机 你 能 到 下 
理解 高 速 缓存 是 如 何 醋 作 的 之 前 ， 你 需要 理解 高 速 缓存 的 结构 是 如 何 导致 这 样 划 分 地 址 伺 的 。 


Jefe] a ге геге 
е [т 
Tel [к pp» px 5 
э [уш [эу [у [тру 


练习 题 67 EX 
读 充 消除 了 冲 窒 不 命中 。 内 此， 站 分 之 三 的 引用 是 命中 的 。 


练习 题 6.8 答案 

月 时 候 ， 理 解 为 什么 某 种 思想 是 不 好 的 ， 能 够 帮助 你 理解 为 什么 另 .种 是 好 的 ， 这 里 ， 我 们 看 
到 的 坏 的 想法 是 用 高 位 来 素 引 高 速 缓 存 ， 而 不 是 用 中 间 的 他。 

A. 用 高 位 做 素 中 ， 每 个 连续 的 数组 组 块 〔chunk) 是 出 ОРН, ХБА. 1А 
此 ， 数 组 头 守 个 连续 的 块 部 会 映射 到 组 0， 接 下 来 的 并 个 块 会 映射 到 组 1， 合 此 类 并 ， 

B. 对 于 直接 映射 高 速 缓 存 (SE.B,m) = (512.1.32.32)， 疝 速 缓存 容量 是 512 个 32 7 TIR, 每 个 
ЕЖ ҰНМЕН t=18 个 标记 位 。 因 此 ， 数 组 中 头 35 个 块 会 瑞 射 到 组 0， 接 个 来 2 个 块 会 映射 到 组 
1。 因 为 我 们 的 数组 只 出 4096/32=512 个 庆 组 成 ， 所 以 数组 中 所 有 的 块 都 被 映射 到 组 0。 因此， 人 在任 
何 时 刻 ， 高速 缓存 至 多 只 能 保存 一 个 数组 块 ， 即使 数 组 足够 小 ， 能 够 完全 让 到 间 速 缓存 中 。 1688 кк, 
用 品位 做 索引 不 能 充分 利 月 高 速 缓 存 ， 















存储 器 时 次 结构 


练习 题 6.0 答案 
两 个 低位 是 块 侦 移 《CO)7， 然 后 是 三 位 的 组 索引 【CI7， 剩 下 的 位 作为 宗 记 《CT); 
12 11 10 9 5 7 6 3 4 4 2 | Ü 





练习 题 6.10 管 案 
Bhhr: OxDE34 
A. Hubs Cg MER TER M 
12 1! 10 9 8 7 б 5 4 3 2 1 0 
о 1а |тоо [о (тіз јо 11101». 
CT CI CT CT CT CT CT CT CI CI Ct CO CÓ 
В. ПУН: 


СТТ | m 
НЕТИЖЕ (СЮ) | вз | 
高 速 缓存 标记 CT) 

; 

(Paranos | o 


练习 题 6.11 ЖЖ 
dhit: OxODDS 
А. 地 由 格式 《每 个 小 格子 表示 一 个 位 ); 





i2 11 10 5 8 T 5 3 4 3 2 1 0 
оао аа еа оао 
CT CT CT CT CT єт Cr єт СІ ГІ СІ CO CO 


B. 存储 器 引用 : 





练习 题 6.12 答案 
地 址 ; OxIFF4 
六、 地 址 格式 《每 个 小 格子 表示 一 个 位 ); 


455 
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CT CT Cl CT CT CT CT CT CI CI CI со со 


B. 存储 器 引用 ，; 











ET 
as И 


ЖЫЮ 6.13 答案 

这 个 问题 是 练习 题 6.9—6.12 ЖР, SORS IE] LE, ААР АЕН ТЕА 
个 组 中 命中 的 地 址 。 在 这 种 情况 中 , 组 3 包含 … 个 有 效 行 , 标记 为 0x32。 因 为 组 中 具有 一 个 有 效 入， 
四 个 地 址 会 命中 。 这 些 邮 址 的 二 进 制 形式 为 001100100 11xx。 央 此 ,在 组 3 中 命中 的 四 个 十 六 进 制 
则 址 是 ，0x064C、0Qx064D、0x064E 和 Ox064F. 


55188 6.14 答案 

А. 解决 这 个 问题 的 关键 是 想像 出 图 6.51 中 的 图 像 。 注 意 ， 每 个 高 速 缓存 行 只 包含 数组 的 一 个 
行 ， 高 速 缓 存 正好 只 够 保存 一 个 数组 ， 而 且 对 于 所 有 的 1、src 和 dst 的 行 映射 到 癌 一 个 局 速 缓存 行 ， 
因为 高速 缓存 不 够 人 人， 不 中 以 容纳 这 两 个 数组 ， 所 以 对 一 个 数组 的 引用 总 是 驱逐 出 另 一 个 数组 的 有 
用 的 行 。 例 如 ， 对 64005 ELTE. src[0][0] 时 加 载 进来 的 那 -… 行 ， 所 以 ， 当 我 们 接 卜 来 
ме. 我们 会 有 一 个 本 命中 。 


t 
| 0 F 17 
srce 


18 . 
dat | Lina 1 


图 551 练习 题 6.14 的 图 






БЕНЕ БЕЛЕ 





В. BDEARTERA 近 字 节 时 ， 它 足够 大 ， 能 容纳 这 商 个 数组 。 因 此 ， 所 有 的 不 命中 都 是 开始 时 
的 冷 不 命中 。 
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练习 题 6.15 答案 

每 个 16 ETERNI AH PUT EHI] algae position 结构 。 每 个 循环 按照 存储 器 顺序 访 
问 这 些 结构 ， 每 次 读 一 个 整数 元 素 。 所 以 ， 每 个 循环 的 模式 就 是 不 俩 中 、 命 中 、 不 命中 、 命 中 ， 情 
ЗЕГЕ. 注意 ， 对 于 这 个 问题 ， 我 们 不 必 实 际 列举 出 读 和 不 命中 的 总 数 ， 就 能 预测 出 不 命中 率 ， 

A Wik Sr £ 512 Tiy. 

B. mST УЕ ЕЕ Р? 256 个 不 命中 。 

C. 不 命中 率 是 多 少 ? 256/512-50%. 


练习 题 6.16 答案 

对 这 个 问题 的 关键 是 注意 到 这 个 高 速 缓存 只 能 保存 数组 的 12。 所 以 ， 按 照 列 顺 序 来 扫 措 数组 
的 第 二 部 分 会 里 逐 扫 描 第 一 部 分 时 加 载 进 来 的 那些 行 。 例 如 ， 读 grid[f16][0] 的 第 一 个 元 素 会 驱逐 当 
我 们 读 gridI0l[O 的 元 束 时 加 载 进来 的 那 一 行 。 这 一 行 也 包含 grid[0j[l]。 所 以 ， 当 我 们 开始 扫描 下 -- 
列 时 ， 对 grid[0][1] 第 -~ 个 元 素 的 引用 会 不 命中 ， 

А RARESA? 512 个 读 。 

В. НЕ ЕТЕ АЕ ЖУЫ? 256 个 不 命中 。 

С. 不 命中 率 是 多 少 ? 256/512-50%. 

D. ЖЖЖ ЕН Pa A. 那么 不 命中 率 会 是 多 少 昵 ?如 果 高 速 缓存 有 现在 的 两 们 大 ， 那么 它 
能 能 保生 整个 grid 数组 。 所 有 的 不 命中 都 会 是 开始 时 的 冷 不 命中 ， 而 不 命中 率 会 是 1/4=25%. 

练习 题 6.17 Ж 

这 个 循环 有 很 好 的 步 长 为 1 的 引用 模式 ， 峡 此 所 有 的 不 命中 都 是 最 开始 时 的 冷 不 命中 。 

A. WS EUR ЖР? 512 个 读 。 

B. RART dn а E? 128 个 不 命中 。 

C. Ai p XE $ b? 256/512-50%. 

D. НА IE BA, 那么 不 命中 率 会 是 多 少 呢 ? 无 论 高 速 缓存 的 大 小 增加 多 少 ,都 不 会 
收 变 不 六 中 率 ， 因 为 冷 不 命中 是 不 可 避免 的 。 

练习 是 6. 怕 管 案 

这 个 问题 只 是 检查 你 是 否 理 解 了 我 们 的 讨论 。 步 长 对 应 于 空间 局 部 性 ， 工 作 集 大 小 对 应 于 时 间 
局 部 性 。 

练习 题 6.19 答案 

A. LI {КТЕН Ж KHA 1000 MBA， 而 时 钟 频 率 大 约 为 500 MHz。 因 此 ,访问 L1 中 的 一 个 
FAHRE 500/1000 X 4 = 2 个 周期 。 

B. 要 估计 12 的 访问 时 间 ， 我 们 需要 确认 存储 器 山上 的 -- 个 区 域 ， 其 中 每 个 引用 都 在 L1 中 不 
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ін, ШЕ L? 中 命中 。 特别 地 ， 我 们 想 要 这 样 一 个 区 域 ， 中 工作 集 对 LI ERKAT, AAE 12 
的 范围 之 内 《例如 ，256 775. ӘРЕКЕТТЕ ӨНІП, БЕЗІ» ЕЕЕ 
中 ， 可 以 观察 到 墩 区 域 【 工 作 集 大 小 =256， 步 长 =16)》 ТІНЕН Ж АРПА 300 MB/s. Ht, В 
h ЛА L2 中 读 个 字 击 要 大 约 500/300 4=7 个 周期 。 

机 估计 主 存 的 访问 时 间 ， 我 们 看 看 山上 那个 步 长 和 工作 集 都 最 大 的 点 ， 其 中 每 个 引用 都 在 LI 
和 2 中 不 命中 。 МАМЕ, XX DOR ( L ERU REM, 步 长 =16) 内 的 读 知 吐 率 大 约 为 80 MBAs， 
因此 ， 我 们 估计 从 证 存 中 读 出 ЧЕКЕНЕ 500/80Х 425 个 周期 。 


| 


2 077 
在 系统 上 运行 程序 


Ж / ЖАЛТ ЖАНИЯ, КАЕ ОА ЕРЕЕН. 9 
а АГЕР ЧЕЗ УКВ PARA, 处理 器 可 六 将 这 个 文件 
ЛЕЕ (memory )， 并 且 执 行 它 。 现 代 操 作 系统 与 硬件 合作 ， 为 每 个 


‚ -各 序 提供 一 种 纪 像 ， 好 像 这 个 程序 是 竹 独占 地 使 用 处 理 器 和 主 存 ， 而 实际 上 ， 在 任何 


时 刻 ， 系 统 上 都 育 多 个 程序 在 运行 。 因 此 ， 要 想 在 这 样 的 系统 上 获得 准确 的 测试 值 ， 
束 震 要 敏锐 的 淘 窒 力 和 小 心 的 设计 规划 。 

在 本 书 的 第 一 部 分 ， 你 很 好 地 理解 了 程序 和 硬件 之 间 的 交互 关系 。 本 书 的 第 一 部 
分 将 拓宽 你 对 系统 的 了 解 ， 使 你 率 固 地 掌控 程序 和 操作 系统 之 间 的 交互 关系 。 你 将 学 
习 到 如 何 使 用 操作 系统 提供 的 服务 来 构建 系统 级 程序 ， 例 如 Unix shell HASERA 
PER. 
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链接 (linking) 就 是 将 不 同 部 分 的 代 玛 和 数据 收集 和 和 丝 人 台 成 为 一 个 单一 文件 的 过 程 ， 这 个 文件 
可 被 加 载 (ЕРЕН) 到 存 情 器 并 执行 。 链接 可 以 执行 于 编译 时 《compile time}， 也 就 是 在 源 代码 
被 番 译 成 机 器 代码 时 ， 也 可 以 执行 于 加 载 时 〈load time)， 也 就 是 在 程序 被 加 载 器 (loader) 加 载 到 
人 在 悄 器 并 执行 时 ， 甚 全 执行 于 运行 时 《man time)， 由 应 用 程序 来 执行 。 在 早期 的 计算 机 系统 中 ， 链 
接 是 手动 执行 的 。 在 现代 系统 中 ， 链 接 是 由 叫做 链接 器 【linkerl 的 程序 自动 执行 的 。 

链接 器 在 软件 开发 中 扮演 着 一 个 关键 的 角色 ， 因 为 它们 使 得 分 离 编 译 (separate compilation) 成 
为 可 能 。 我 们 不 用 将 个 大 型 的 应 用 程序 组 织 为 “个 已 大 的 源 交 件 ， 和 击 是 可 以 把 它 分 解 为 更 小 、 更 
好 管理 的 模 卡 ， 可 以 独立 他 懂 改 和 编译 这 些 模 志 。 当 我 们 改变 这 些 模块 中 的 一 个 时 ， 我 们 只 要 简单 
地 重新 编 评 它 ， 并 将 它 重新 链接 到 应 用 二， 而 不 必 重 新 编 评 其 全 文件 。 

链接 通常 是 由 链接 器 米 安 静 了 地 处 理 的 ， 对 于 那些 在 编程 人 门 课堂 上 构造 小 程序 的 学 生 而 言 ， 链 
接 不 是 一 个 重 旧 的 说 题 。 那 为 什么 还 要 这 人 么 麻烦 地 学 习 关 于 链接 的 知识 呢 ? 

. 理解 链接 器 将 帮助 你 构 造 大 型 程序 , 构造 人 型 程序 的 程序 员 经 常会 遇 到 由 于 缺少 模块 、 缺 少 

库 或 者 不 兼 穿 的 库 咸 本 引起 的 链接 器 错误 。 除 非 你 理解 链接 器 是 如 何 解 术 引 用， 什么 是 库 
以 及 链接 器 是 如 何 使 用 库 来 解析 引用 的 ， 否 则 这 类 错误 将 令 你 感到 过 惑 和 性 败 。 

。 理解 链接 器 将 帮助 你 避免 一 些许 险 的 编程 错误 。Unix 链接 器 解析 符号 引用 时 所 做 的 决定 可 
以 不 动 声色 地 注 响 你 程序 的 正确 性 。 在 默认 情况 下， 错误 地 定义 争 个 全 局 变量 的 程序 将 通 
ЕЕ ШАРАН Ж ЫАМ. BILG РЕЛЕ АКЕ ЈА ТМТ у. ІШЕ 
非常 难以 调试 . ЖП S RE x e БЕШ. ELA ASYA E. 

。 理解 链接 将 帮助 你 理解 语言 的 作用 域 规则 是 如 何 实现 的 。 例 如 , 全 局 和 局 部 变量 之 间 的 区 划 
是 什么 ? 当 和 你 定 立 一 个 具有 静态 属 性 的 变量 或 者 半数 时 ， 到 底 实 际 意味 着 什么 ? 

e 理解 链接 将 帮助 你 理解 其 他 重要 的 系统 概念 ,链接 器 上 产生 的 可 执行 日 标 文件 在 重 昧 的 系统 功 
ЕЛЕҢ ТЕ, EMRET КЕТЕ АВ. ЯН ЫН. 

e REB AR ЛЕ ЕЛ. ЕШ Ж, WSA U A P JURA АЈ. ЖШ. ЙІ 
者 共 至 库 和 动态 链接 在 现代 操作 系统 中 日 益 加 强 的 重要 性 ， 链 接 成 为 了 一 个 复 淋 的 过 程 ， 
它 为 知识 丰 晶 的 称 邦 员 握 供 了 强大 的 能 力 。 比 如 ， 许 多 软件 产品 使 用 共享 库 在 运行 时 来 升 
级 压缩 包装 的 (shrink-wrapped) 一 进 制程 序 - 还 有 ， 大 多 数 Web 服务 器 部 依赖 于 共 学 库 的 
动态 链接 来 提供 动态 内 容 。 

这 一 章 提 供 了 关于 链接 各 方面 的 一 个 彻底 的 讨论 ， 从 传统 静态 链接 ， 到 加 载 时 的 共享 库 的 动态 
链 找 ， 以 及 到 运行 时 的 共 时 库 的 动态 链接 。 我 们 将 使 用 实际 示例 来 描述 基本 的 机 制 ， 而 县 我 们 将 识 
放出 链接 问题 下 哪些 情况 中 会 影响 你 程 座 的 性 能 和 正确 性 。 为 了 使 描述 基体 和 可 理解 ， 我 们 的 讨论 
ЖАНА; Ет 1А32 机 器 ， 工 面 运行 着 某 个 版 本 的 Unix, БҮЙ Linux 或 者 Solaris， 使 用 
的 是 标准 物 ELF 日 标 文件 格式 然而， 无 论 是 什么 样 的 操作 系统 、ISA 或 者 是 日 标 文件 格式 ， 基 本 
的 链 这 概 个 是 通用 的 ， 认 识 到 这 -n EREM. MERETE MERS EAER. 
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考虑 图 ТА TH C ERIS. КАЗА Е. main.c 和 swap.c, МАШ тато A swap， 它 交换 
外 部 全 局 数组 buf 中 的 再 个 元 素 。 一 般 认为 ， 这 是 一 种 奇怪 的 交换 两 个 数字 的 方式 ， 但 是 它 将 作为 
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芮 穿 本 章 的 “个 小 的 这 行 未 铺 ， 来 帮助 我 从 说 明基 于 链接 是 如 何 了 工作 的 一 些 重 要 知识 点 。 

大 多 数 编译 系统 提供 编译 驱动 程序 《compiler driver), CAAD., REER AAE B TRA BUR. 
编译 器 、 汇 编 器 和 链接 器 。 比如， 要 用 GNU 编译 系统 构造 示例 程序 ， 我 们 就 要 通过 在 shell 中 输入 
下 列 命 令 行 来 调用 GCC 驱动 程序 : 

unix > gcc -D2 -g -0 p main.c swap.c 

code/Tink/main.c 


+ + 
codeflink/main.c 1 /* swap.c / 
| 2 extern int khuf]; 
1 P* main.c */ 3 
4 Н . 
2 volà swap; 4 int *bufp = &buf[0]; 
“ | | 5 int *oufpl; 
4 int bu:[2] = {1, 2): 6 
Е 
- | 7 void swapí! 
É int mani) 
қ В { 
{ 9 int temp: 
8 вмар(1; 10 
9 return 0; 11 bufpl = &buf(ll; 
10) | 12 -emp = *bufp0; 
code/link/main.c 13 *bufpÜ = *bufpl; 
14 *bufpl - temp: 
ls 
65) mainc T e pt codeltink/main c 
图 7.1 示例 程序 I 


这 个 示例 程序 由 两 个 源 文革 组 成 ，mainc 和 swepe. main 函数 初始 化 一 个 两 元 素 的 整数 数组 ,然后 调用 wap ARRATIA 
AT 


图 7.2 ҖЕ ТЖЕЛЕЙ ИК HERI А. ASCII 个 源 文件 翻译 成 可 执行 目标 文件 时 的 行为 《如 户 
你 想 自己 看 看 这 些 步 蚤 ， 用 -v 选项 来 运行 ОСС.) 戏 动 程序 首先 运行 C 预 处 理 器 Cpp CHCH 
源 程序 maine HERA ASCI 码 的 中 间 文 件 тайшы: 

cpp [other arguments] main.c /tmp/main.i 

接 下 来 , 驱动 程序 运行 C 编译 器 Cec1), ЕЖ maini 翻译 成 一 个 ASCH 汇编 语言 文件 为 mains. 

ccl /tmp/main.i main.c -02 [other arguments] -o /tmp/main.s 

然后 ， 谈 动 程序 运行 汇编 器 《as》， 它 将 mains НЕҢ -个 可 重 定位 目标 文件 (relocatable object 
file? main.o: 

as [other argaments] -o /tmp/main.o /tmp/main.s 

驱动 程序 经 过 相同 的 过 程 生 成 swap.0。 最 后 ， 它 运行 链接 器 程序 d, £ maino 和 swap.o 以 及 
ЗЕН ЖАН ОЕ ЕЖ, ВИЕ ГВ БА (executable object file) p: 

ld -o p [system object -iles and args] /tmp/main.o /tmp/swap.o 

Wiru ir УЙ р. ЖІП Unix shell 的 命令 行 上 输入 它 的 名 学 ， 


unix» ./p 
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таг. Ewap.c mx d 


Bia Шеш 
(epp, ccl, аһ) [срр, cel, as) 





ша: SWAR- G ЕГЕН x UE 


| HS Oa | 
完全 链接 的 
可 执行 卓 标 文件 
图 7.2 静态 链接 
链接 器 将 可 重 定 位 日 标 文件 组 合成 一 个 可 执行 有 标 文件 p， 


shell 调用 个 在 操作 系统 中 而 做 加 载 器 Соайег) ЖЖ, ЙЕЛ а AAT Ж: p HARTA 
据 到 在 赃 器 ， 然 后 将 控制 转移 到 这 个 程序 的 开头 。 


7.2 静态 链接 


像 Unix ld 程序 这 栏 的 静态 链接 路 【static linker) 以 一 织 可 重 定位 日 标 文件 和 命令 行 参 娄 作为 输 
A. RB -个 完全 链接 的 可 以 加 载 和 运行 的 可 执行 目标 交 忻 作为 输出 。 输 入 的 可 重 定位 日 标 诡 件 出 
各 种 不 同 的 代码 和 数据 节 (section》 组 成 。 指 令 在 一 个 节 中 ， 初 始 化 的 全 局 变量 在 另 一 个 节 中 ， 而 
术 初 始 化 的 变量 又 在 另外 一 个 节 电 ，。 
为 了 创建 可 执行 文件 ， 链 接 器 必须 完成 两 个 主要 任务 ， 
. 符号 解析 【symbol resolution)。 日 村 文件 定义 和 引用 赫 号 。 符 号 解析 的 由 的 是 将 每 个 符号 引 
用 和 和 一个 符号 定义 联系 起 来 。 
* X42 (rejocation)。 编 详 器 和 汇编 器 生成 从 地 址 零 开 始 的 代 人 码 各 数据 节 。 链 接 器 通过 把 每 
个 符号 定义 与 一 个 存储 上 器 位 置 联系 起 米 ， 然 后 修改 所 有 对 这 些 符号 的 引用 ， 使 得 它们 指 癌 
DOS risa AETAT., 
ETERRA A K E ШТЕЙ hiik at pa. ЕЛЕНЕ, Жып УТ SEEN) e ER 
X: 日 标 文件 纯粹 是 字 节 块 的 集合 。 这 些 抉 中 ， 有 些 包 含 程序 代码 ， 有 些 则 包含 程序 数据 ， 而 其 他 
的 则 包含 指导 链接 器 和 加 载 器 的 数据 结构 。 链接 器 将 这 些 块 连接 起 来 , 确定 被 链接 块 的 运行 时 位 置 ， 
并 且 修 改 代码 和 数据 块 中 的 各 种 位 置 。 链 接 器 对 目标 机 器 了 解 其 少 ， 产 生日 标 文件 的 编译 器 却 汇 总 
Жк СЯ. [АИТ Lt. 


73 目标 文件 
目标 文件 有 三 种 形式 : 


° 可 重 定 位 月 标 文件 。 包 售 二 进 制 代码 和 数据 ,其 形式 可 以 在 编 谋 时 与 其 他 可 重 定位 月 标 文 件 
合并 起 来 ,创建 一 个 可 执行 日 标 文件 。 
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« 可 执行 目标 文件 ,包含 二 进 制 代码 和 数据， 其 形式 可 以 被 直接 拷贝 到 存储 回 并 执行 。 
* 共享 目标 文件 。 一 种 特 吻 类 型 的 可 重 定位 日 标 文件 , 可 以 在 加 载 或 者 运行 时 , 被 动态 地 加 载 
到 存储 器 并 链接 ， 
编译 器 和 汇编 回 生 成 可 重 定位 只 标 文 性 ( 包 描 共 享 月 标 文件 )。 链 接 器 生成 可 执行 目标 文件 。 从 
技术 上 来 说 ， 一 个 具 标 模块 《object module》 就 是 一 个 字 节 序列 ， 而 一 个 目标 文件 (object Ше) Ж, 
是 一 个 存放 在 磁盘 文件 中 的 目标 模块 。 不 过 ， 我 们 还 是 互 换 地 使 用 这 些 术 语 。 
各 个 系统 之 间 ， 日 标 文件 格式 都 不 相 同 。 第 一 个 从 外 尔 实验 室 诞 后 的 Unix 系统 使 用 的 是 а.ош 
格式 《直到 今天 ， 可 执行 文件 仍然 指 的 是 aout XF), System V Unix 的 早期 版 本 使 用 的 是 COFF 
(Common Object File format， 一 般 目 标 文件 格式 )。Windows 使 用 的 是 COFF 的 一 个 变种 ， 叫 做 PE 
(Portable Executable, ПІ п) RIT 20. MA Unix 系统 一 一 比如 Linux, A System V Unix 
后 来 的 版 本 ， 各 种 BSD Unix， 以 及 SUN Solaris 一 一 使 用 的 是 Unix ELF (Executable and Linkable 
Format, 可 执行 和 可 链接 格式 )。 尽 管 我 们 的 讨论 集中 在 ELF 上 上， 但 是 不 管 是 哪 种 格式 ， 基 本 的 概 
念 是 相似 的 ， 


74 可 重 定 位 月 标 文件 


图 7 了 3 展示 了 -- 个 典型 的 ELF 可 重 定位 上 月 标 文 件 。ELF Ж (ELF header) 以 一 个 16 字 节 的 序列 
开始 ， 这 个 序列 描述 了 字 的 大 小 和 生成 该 文件 的 系统 的 字 节 顺序、ELF 头 利 下 的 部 分 包含 帮助 链接 
氮 解 析 和 解释 日 标 文件 的 信息 。 其 中 包括 ELF 站 的 大 小 、 日 标 交 件 的 类 型 + 比 恕 ， 可 重 定位 、 可 的 
行 或 者 是 共 语 的 、 机 器 类 型 (比如 ，IA32)、 节 头 部 表 (section header table) КУНІНЕ, АА 
头 部 表 中 的 表 目 大 小 和 数量 。 不 同 节 的 和 位置 和 大 小 是 由 节 头 部 表 机 述 的 ， 其 中 日 标 文件 中 每 个 节 都 
有 一 个 国定 大 小 的 表 日 (entry)。 













.debug 


line 


.strtab 


73 典型 的 ELF 可 重 定位 目标 文件 


KE ELF 头 和 和 节 头 部 才 之 癌 的 都 是 节 。- -个 典型 的 ELF 可 重 定 位 日 标 文件 包含 下 面 儿 个 节 ; 
-text: 已 编译 程序 的 机 器 代码 。 
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:rodata: 只 读数 据 ,比如 printf rtg rb МАНІ ( switeh) АЈ КИЙН МАХ 7.14), 

data: 5,554669 4j C ERE. БШ С 变量 在 运行 时 被 保存 在 栈 中 ， 既 不 出 现在 .data Ht, В 
不 出 规 在 .hss ҮЯТ, 

,ss: 未 初始 化 的 全 局 和 变量 在 目标 文件 中 这 个 节 不 占据 实际 的 室 间 ， 它 从 仅 是 一 个 占 倍 符 。 
目标 交 件 格式 区 分 初始 北 和 未 初始 化 变量 是 为 了 空间 效率 ， 在 目标 文件 中 ， 末 初始 化 变量 不 渍 要 占 
所 任何 实际 的 磁盘 空间 ， 

Symtab:—4- E Җ. (symbol table)， 它 存放 在 程序 中 被 定义 和 引用 的 函数 和 全 局 变量 的 信息 。 
一 些 程序 员 错 误 地 认为 必须 通过 -g 选项 来 编译 一 个 程序 ， 得 到 符 导 表 信 息 。 实 际 上 ， 等 个 可 重 定位 
日 标 文 件 在 .symtab 中 痢 有 一 张 符 号 表 。 然 而 ， 和 编译 器 中 的 符号 表 不 同 ，.symtab FEEDER J) 
РНН. 

Tel,text: 当 链接 器 把 这 仿 目 标 文件 和 其 他 文件 结合 时 ，.text 节 中 的 许多 位 置 剖 党 要 修改 。 一 艇 
而 言 ， 任 何 调用 外 部 函数 或 者 引用 全 局 变量 的 指令 部 需要 修改 . 另 一 方面 ， 调 用 本 地 疯 数 的 指令 则 
ЖШЕЖШ. ПЕ, ПИ КЕНЕТТЕН АНА, MEAR AR НЕМЕНЕ ШЕ ТАЛЫН 
示 链 接 器 包含 这 些 信 息 ， 

,rel.dgata: 被 模块 必 六 或 于 用 的 任何 全 局 变量 的 信息 ， 一般 而 言 ， 尾 何 已 补 始 化 全 局 变量 的 初 疗 
慎 是 全 局 变量 或 者 相 部 定义 消 数 的 地 址 都 需要 被 履 改 。 

,debug: 一 个 调试 符号 表 ， 其 有 些 表 日 是 程序 中 定义 的 局 部 变量 和 类 型 定义 ， 有 些 表 日 是 程序 中 
定义 和 引 放 的 全 局 变量 ， 有 些 基 原始 的 EC 源 文 件 ， 只 有 以 -g 选项 调用 编 详 骤 动 程序 时， 才 会 得 到 这 
35. 

dine: Fia C 源 程序 中 的 行 号 和 .text Ti P НЕ S2 [8] E BAUR] «UR Е-е W iB ЕДІН 
时 ， 才 会 得 到 这 张 表 ， 

.strtab: -个 字符 串 表 ， 其 内 容 包括 .symtab 和 .debug 节 中 的 符号 表 ， 以 及 季 头 部 中 的 竹 名 字 。 字 
APERE null АНЫН ТАНУ. 

旁 注 ， 为 什么 未 初始 化 的 数据 称 为 .bss? 

用 术语 ,bss RETRAIRE ARA, TRT IBM 704 汇编 语言 ( 大 的 在 1957 年 ) 
中 “ 块 存储 开始 (Block Storage Stat ) 指 售 的 首 宇 母 缩写 ， 并 沿用 至 今 ， 一 个 记 住 区 分 ,data 和 .bss 
节 的 简单 方法 是 把 “bss” 看 成 是 “更 好 地 节省 空间 【Better Save Space)!" 4585. 


75 ”符号 和 行 号 表 


&^ ur mu BRE m 如 有 一 个 符号 表 ， 它 包含 m 所 定义 和 引用 的 符号 的 信息 ,在 链接 器 
的 上 下 文中 ， 有 一 种 不 同 的 符号 ; 

* 由 m 完 义 并 能 被 其 他 模块 引用 的 全 易 符 叶 。 全 局 链接 器 符号 半 应 十 非 静 态 的 CC ЖЖП RAE 
EXAT C H static 属性 的 全 局 安 量 。 

《出 其 他 模块 定义 并 被 模块 m 引用 的 全 局 着 号 。 这 些 符号 称 为 外 部 符号 CextemaD 对 应 于 出 
名 在 其 他 模块 中 的 CC Р Н ЖШ. 

* 只 被 模块 m 定义 和 引用 的 本 地 符号 。 有 的 本 地 链接 器 符号 对 应 于 带 static 属性 的 C 国 数 和 
全 局 变量 。 这 些 符号 在 模块 m 中 的 任何 地 方 都 是 可 见 的 ， 但 是 不 能 被 其 他 模块 引用 ,日 标 
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XTPPIIB TEE m ЁГЕ Н CIEL Sr E cH E. 
认识 到 本 地 链接 器 符号 和 本地 程序 变量 的 不同 是 很 重要 的 。.symtah 中 的 符号 表 不 包含 对 应 于 本 
地 非 静 态 程 序 变 量 的 尾 何 符号 ， 这 些 符号 在 运行 时 在 本 中 被 管理 ， 通 接 器 对 此 类 符号 不 感 兴趣， 
有 趣 的 是 , ur X Wí C static 故 性 的 本 地 过 程 变量 是 下 在 栈 中 管理 的 ,取而代之 , 护 评 器 在 ,data 
Hibs h Jy p yE X mV. JE TES deni Tf — FO BEREBTES. IE. B 
TEFI— BOR miS T A CE Ж Т — Bo e E x: 


1 int 14) 

д [ 

3 static int x = Q: 
d return x; 

5 | 


b 
7 int gij 
B | 


3 Btatic Iing x = 1: 
10 return X; 
11 ] 


(EX PHP. ЖЕ TE es h LIC ES IS], ESI HI (ехроп) MAE ПЕСНЕ ВЕНЕ ЧЕ 
FORCAR. ЕШ, КЕПШ хл ATAR HHE ЕН x 23608 р 中 的 定义 ， 
CERTA: 利用 staic NEMUS 8 Ira tk 2 * | 

CAFRA smie АНДИМА АВА ЛЕВИ, EHE hva e Ck AR publie 
和 private 声明 一 样 。 С AEPGR X ЬН Й Ё, (ET EUR анс ДНН h ААН 
BOLD d). Жын, (En 59 майс Bl dee dede dlc den. Takie 
ЖАА, ETEA шк Н PES Е I E ELIT HA ЧИ. 

符号 表 是 由 汇编 器 构造 的 ， TE HL HF RA HH REL SIB s 交 忻 中 的 符号 。,symtab ізі Ж ELF 
MER. RET RUR- X T4 HIS. Ш14Ш ЕТЕТ Семгу) 的 格式 ， 


code/tink/elfstructs.c 
l typedef struct { 
2 int name; P* siring table offset */ 
3 int value: ~ section offset, ar VM address | 
4 Int size; /* object size in bytes */ 
5 char type:4, "е data. func, section, or src file name (4 bits) */ 
Б binding:4; І" local or global (4 hits) */ 
7 char reserved; іе unused */ 
B char section; !® section header index, ABS. UNDEF, */ 
9 "әт COMMUN */ 
10 | Elf Symbol; 
c ыы... есе code/Tink/elfstructsc 


E74 ELF 符 导 表亲 目 
type 10 banding MAE 4 Dri. 
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name РАЈ Е, ЗЕРЕ nul Е ОРН AE. value 是 符号 的 地 址 。 
对 于 可 重 定 们 的 模块 来 说 ，value 是 距 定 头 日 标的 节 的 起 始 位 置 和 的 偏 黎 。 对 十 可 执行 目标 文件 来 说 ， 
该 值 是 一 个 绝对 运行 时 地 址 ,size 是 目标 的 大 小 【以 字 节 计算 )。type 通常 要 么 是 数据 , S 2 ERA 
符号 表 还 可 以 包含 各 个 节 的 表 日 ， 以 及 对 应 原始 源 交 忻 的 路 径 名 的 表 日 。 所 以 这 些 口 标的 类 型 也 有 
所 不 同 。Binding 域 表示 符号 是 本 地 的 还 是 全 局 的 。 

每 个 符号 都 和 目标 文件 的 某 个 节 相 关联 ,由 section ЖЕЛ, 该 域 也 是 一 个 到 节 甘 表 的 索引 。 有 
二 个 特殊 的 俯 节 (‘pseudosection)， 它 们 酝 竹 涉 表 中 是 没有 表 日 的 ，ABS 代表 不 该 被 重 定 位 的 符 吴 ， 
UNDEF 代表 未 定 区 的 符号 【比如 ， 在 本 月 标 模块 中 引用 ， 但 是 却 酝 其 他 地 方 定 闷 的 符 豆 )， 和 而 
COMMON 表示 还 未 被 分 配 位 置 的 术 初 始 化 的 数据 目标 。 对 于 COMMON 符号 ，value 域 给 出 对 齐 请 
求 ， 而 size 给 出 最 小 的 大 小 ， 

Ш, Р maino 的 符号 表 中 的 最 后 个 表 日 ， 通 过 СМО READELF ВНЖ. Jio 
的 8 个 表 目 没有 显示 出 来 ， 是 链接 器 内 部 使 用 的 本 地 符号 。 


Num: Value Size Type Bind Ot Мах Name 
8: Ü 8 OBJECT GLOBAL 0 3 buf 
9: 0 17 FUNC GLOBAL 0 ] main 
10: Ü П NOTYPE GLOBAL 0 UND Swap 


在 这 个 例子 中 ， 我 们 看 到 一 个 关于 全 局 符号 buf 定 立 的 表 上 日 ， 它 是 一 个 位 于 .data ЧЕХ 
(Bl value) 处 的 8 字 节 目标 。 其 后 跟随 着 的 是 全 局 符号 main 的 定义 ， 它 是 一 个 位 十 .text р 
АЗАН 17 字 节 函数 。 最 后 -个 表 目 来 白 对 外 部 符号 swap 的 引用 。READELF 道 过 一 个 整数 索引 
来 标识 每 个 节 。Ndx=l #лулех! 节 ， 而 Ndx=3 表示 .data V. 

相似 地 ， 下 面 是 swap.o 的 符号 表 表 日 : 


Num: Value Size Type Bind Ot Hdx Name 
B: Ü а OBJECT GLOBAL 0 3 bufpü 
9: Ü 0 NOTYPE GLOBAL 0 UND buf 

10: Ú 39 FUNC GLOBAL 0 1 swap 
11: 4 4 OBJECT GLOBAL 0 COM bufpl 


Ел, 我 们 看 到 一 个 关于 全 局 符号 bafpo 定义 的 表 日 ， 它 是 从 .data 中 偏 称 为 零 处 开始 的 一 个 4 
字 节 的 已 初始 化 日 标 。 F 个 符号 来 在 Биро 的 初始 化 代码 中 芍 对 外 部 符号 buf 的 引用 。 后 面 紧 随 
的 是 全 局 符号 swap， 它 是 一 个 位 于 .text 中 偏 移 为 零 处 的 39 字 节 的 明 数 。 最 后 一 个 表 日 是 全 局 符号 
bufpl， 它 是 个 未 初始 化 的 4 字 节 数据 日 标 〈 要 求 4 字 节 对 齐 y， 最 终 当 这 个 模块 被 链接 时 它 将 作 
为 一 个 .bss 目标 分 配 。 


Sk SII 7.1 
这 个 题目 是 关于 图 7.1 (b) 中 的 swap.0 模块 。 对 于 每 个 在 swap.0 中 定 头 或 引用 的 符号 ， 请 
指出 它 是 否 在 模块 swap.o 中 的 .symtab 节 中 有 一 个 罕 号 表 表 目 。 如 果 是 ， 请 指出 定义 该 符号 的 模 


块 (swap.o 或 者 main.o }、 符 号 类 型 ( 本 地 、 全 局 或 者 外 部 ) 和 它 在 模块 中 占据 的 节 【 ,text，,data 
或 者 ,bss )， 
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链接 腥 解 本 符号 引用 的 方法 是 特 紫 个 引用 与 它 输 六 的 可 重 定位 目标 支 件 的 符号 甫 中 的 一 个 确定 
的 符 导 定 匀 联系 起 来 。 对 那些 和 引用 定 谱 在 相同 模块 中 的 本 泡 符 号 的 引用 。 罕 号 解析 是 非常 议 单 时 
了 的 。 蜗 译 器 只 多 许 每 个 模块 中 的 扯 个 村 地 符号 只 有 一 个 定义 。 凡 评 器 还 确保 甬 态 本 地 变量 ， 筷 们 
也 合 有 本 地 链接 器 符号 ， 拥 有 惟一 的 名 字 ， 

Ай. АО ОЕТ Е ЕИ Ж. ЕА BI R d SW HÓ GE Xt s E 
最 或 函数 名 】 gH. ЕТАР ДЕТЕ ТУ ЕР ТЕ ИШ. ER TERES ЕЖЕН. НЕ 
ЖЕНЕКЕ. m tH HEEL FECI BUR PEST BIB. ERE * 
Gf dE RUE Wiki mis. ШШ. ШЙ ПИАЖЕ E Linux WA LAENE E 
xt 


1 võid foaoilvold!; 
inb maini) í 


fool; 
rerurm D; 


ён Шт oe de Fa 


] 

Hoti Sis E SERR LAA foo HIAR. Cak.: 

unix» gcc -Wall -02 -o linkerror linkerror.c 

f/tmp/ce8z5uti.ó: Іп function 'main': 

/tmp/ccSzh5uti.o(.text«0x7T]: undefined reference to 'foo' 

collect2: id returned l éxit statum 

uc meme T. ЖИУНЕНМТЕНЕСЗПІКЖІБЕЯ. (ish er. B 
IESU S o5 Ей, BAUERT Fi НЕЕ X. Unix ЖЖ KRE ok 
fuse ИК. ЛДЕН BD [И E, PEE aE S РЕНИН АТТАН. 
ЯН, m C4+ 和 Java CREE ЕНЕ (mangling) 

Cede Java АЛТА, Ила ан» ET. pj еи K. má 
НЕБАБМЕННЕТЕНЯЖЕ АЛЫН ЕН? Ceo Java P bba fk RE. EE S d 
Ее EACH ALL OR HERE KOREA, нийдин a mit 
( mangling) &d9& #1415 | í demangling ), | 

ЖЕН. Ced laya Ë P ЖИЕК. — E RI Б + ЯШЕ F FERR, 
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EdÓOE Ed ST ES. Кк, X Foo 被 编码 成 3Foo， 方 法 被 编码 为 原始 方法 名 ， 关 面 加 上 2) 
上 已 总 丸 类 的 类 和 名， 再 加 上 每 小 条 数 的 一 个 字母 ， 比 如 ，Fooc'cbartint long) ЖИА bar 3Fooil, 
Sire Bk de dS d ex SERA. 


761 链接 嚣 如何 解析 多 处 定义 的 全 局 符号 

在 编 详 上 时， 编译 器 输出 每 个 全 局 符号 给 汇 纺 器， 成 者 是 强 〔strong)， 或 者 是 弱 (weak), TU 
编 器 把 这 个 信息 隐 含 地 编码 在 可 重 定位 日 标 交 人 忻 的 符号 表 时 ,应 数 和 已 初始 化 的 全 车 变量 是 强 符 与， 
未 初始 化 的 全 局 变量 是 收 符 号 。 对 于 图 7.1 中 的 示例 程序 , buf. bufp0、main 和 swap 是 强 符号 , bufpl 
ASH y. 

ЕЕЕ EX. Unix 链接 器 使 用 下 面 的 规则 来 处 理 多 处 定义 的 符号 ; 

є НШ 1: ^fespaEeTuNE. 

s A2: АВЕ 5. ДАБ. 

+ 规则 3， 如 果 有 多 个 弱 符 导 ， 那 么 从 这 些 弱 符 号 中 任意 选择 一 个 。 

Ш, fs BHL TC PRECOR EE PIN CORRER: 


L Ре fool.c */ 1 /* barl.c */ 

2 int шаіп() 2 int mainit 

3 [ 3 { 

4 return 0; 4 return 9; 
9 } 5 | 


在 这 个 示例 中 ， 链 接 器 将 生成 一 条 错误 信息 ， 因 为 强 符 号 main о XJ ЖК GAN 12: 
unix gcc Eool,c barl,c 

ҒЕшр/сса015022.о: In function 'main': 

/tmp/cca015022.0(.text«0x0): multiple definition of 'main' 


/tump/cca015021.04(.texte0x0): first defined here 


相似 地 , 链接 器 对 于 下 面 的 模 据 也 会 生成 一 条 错误 信息 因为 强 符 号 x 被 定义 了 两 次 (规则 1): 


1 /* foo2.c */ 1 /* bar2.c */ 

2 int x = 15213; 2 int x = 15213; 
3 3 

4 int maini] 4 void ГІ) 

5 { 2 i 

Ё return 0: б } 

7 } 


Жї, ТЕ ASI RE x ЖЖ ЛЕН. AA ЕНЕНЕ ER EE УВЕ ВИЧ 
号 《规则 2): 


1 /* [oo3.c */ 1 /* Ъаг3.с *j 
2 *include «stdio.h- 2 int x; 

3 void fí(void); 3 

4 4 void fi: 
5 int x = 15213; 5 { 
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ú 6 x = 15212; 
7 int maln() 了 ) 

B i 

9 fib 

10 printfí("x = а\п", x); 

11 return Ü; 

12 } 


在 运行 时 , Rm {Ж x ИЕНІ 15213 改 为 15212, 这 会 给 main 函数 的 作者 带 来 不 受 欢 迎 的 惊奇 ! 
注意 ， 链 接 器 通常 不 会 表明 它 检测 到 多 个 x 的 定义 ; 


unix> gcc -о foobari feoj3.c bari.c 
unix> ./foobar3 


x = 15212 

如 杂工 有 了 阅 个 能 定义 ， 也 会 发 生 相 同 的 事情 【规则 3). 

1 Ж food c */ 1 J* bard.c *J 
2 &include «stdio.h» 2 int x; 

3 void E(tvoid); 3 

4 4 void Ё() 
5 int X: 5 r 

2 Б x = 15212: 
7 int maint) 7 ] 

B i 

9 x = 15213; 

19 fü 

11 printfi"x = $d*n", x); 

12 return 0; 

13 ) 


UN 2 和 规则 3 的 应 用 会 造成 一 些 不 易 察 觉 的 运行 时 错误 ， 对 于 不 知情 的 程序 员 来 说 ， 是 很 难 
理解 的 ， 尤 其 是 如 果 重 复 的 符号 定 尽 还 有 不 同 的 类 型 时 。 考 虑 下 面 这 个 例子 ， 其 中 x 在 一 个 模块 中 
EXA int， 而 在 男 一 个 模块 中 定 习 为 double。 


1 /* foo5.c */ 1 {* bar5.c *j 
2 include «stdio, h> 2 double x; 
3 void fivoid); 3 

4 4 void fi) 
5 int x - 15213; 5 { 

6 int y = 15212; б x = -0.0; 
7 7 ) 

8 int maint} 

9 { 

10 Бі); 

11 printf("Xx = Dx$x y = [x%x xn", 

12 


A, ү); 
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13 return 0: 
lá ] 


在 一 台 IAX/Linux 8 k, doube 类 型 是 8 个 学 节 ， 而 in 类 型 是 4 个 字 节 。 因 此 ，barc 的 第 
6 行 中 的 赋值 х--ООННАКИ ХЕ K a fé ED x A y FERE Goose IPIE 5 行 和 
Ж 617! 

linux» gcc -o foobar5 foob5.c barb5.cz 


linux» ./foobar5 
x = 0х0 y = бОх800000С0 


Е-Е ARENA, THERJE RER ЖИКИЛ ЫН» ml 
ham yh ji AD A ВНЕ, ШЖ ШЕ ЕЛЕН. dE— 48 JL B АНЫ АЙ RAE 
ф, ТЕТЕ АН АЖЕ ТЕ, ЖЕНА ФЕН АЛ АЛАН ЕН ДЕД. ШИ Т.Е. ИЯ 
有 此 类 错误 时 ， 带 像 GCC-warn-commaon 这 样 的 选项 调用 链接 器 ， 这 个 选项 告诉 链接 器 ， 在 解 初 多 
m Xe SEXE. uS EE. 


83188 72 

在 此 题 中 ，REF(x.i) 一 DEF(x.k) 表 示 链 接 器 将 把 模块 i 中 对 符号 x MESI SUR k P x 的 定 
义 联 系 起 来 。 对 于 下 面 的 每 个 示例 ， 用 这 种 表示 法 来 说 明 链 接 器 将 如 何 解析 每 个 模块 中 的 多 个 定义 
的 符号 如果 有 一 个 链接 时 错误 {规则 1), dnb "ERROR", 如 果 链 接 器 从 定义 中 任意 选择 一 个 【 规 
013), Rr "UNKNOWN". 


А. 
/* Module 1 */ /* Module 2 */ 
int mani) int main; 
{ int p21) 
) { 
} 
(a) ВЕЕ'ша1п.1) --> ПЕРІ EE 
(b) REF/main.2) --> ПЕЕ! 03 
B. 
/* Module 1 */ /* Module 2 */ 
void maini} int main-l; 
i int p2í] 
| { 
} 
ба) ЕЕЕ(шаїп,1) --» ПЕЕ | 222) 
ib) REF(main.2) --> DEF: Oo 
C. 
;* Module 1 */ /* Module 2 */ 
int X: double xzi.t; 
völd mainit 


(a) REF{x.1} --> DEF: 
(b) REFIX.2) --> DEF! 


int р21) 
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和 运 今 为 目 ， 我 们 都 放眼 设 链 接 赌 读 阮 ”组 可 重 定 位 日 标 广 件 ， 并 把 它们 链接 起 来 ， 成 为 一 个 答 
出 的 可 执行 文件 。 实 际 .上 ， 所 有 的 总 译 系统 都 提供 一 种 机 制 ， 将 所 有 相关 的 目标 模块 打包 为 -个 单 
WREX. RAEE (static library )， 它 也 可 以 用 做 链接 器 的 输入 。 当 链接 器 构造 “个 输出 的 可 
执行 文件 时 ， 它 只 找 贝 静态 库 电 被 应 用 程序 引用 的 日 标 异 块 。 

为 什么 系统 要 文 持 库 的 概念 呢 ? 以 ANSI C 为 例 ， 它 定义 了 一 组 广泛 的 标准 ШО. МЕНІН 
НЖЖ, PAN atoi, printf. scanf 和 random。 它 们 在 libca 库 中 ， 对 每 个 C 程 序 来 说 部 是 可 用 的 。 
ANSI C 还 在 libm.a EP EXT -A REFRE RANG Pi sin. cos 和 sqrt。 

让 我 们 来 看 看 如 此 不 使 用 静态 库 ， 编 译 器 开发 人 员 会 使 用 什么 方法 来 向 用 尸 提供 这 些 卫 数 。 一 
种 方法 是 让 编译 器 辨认 出 对 标准 晴 数 的 调用 ， 并 直接 生成 相应 移 代 码 。Pascal， 只 提供 了 一 小 部 分 
ЕЖ, ЖИА] ЛЕ. {НДЕ ЛЕМ C 而 言 是 不 会 透 的 , BEDA C EE X. ARME 
准 函 数 。 这 种 上 方法 将 给 编译 器 增加 显著 狗 复 杂 性 ， 而且 每 次 添加 、 删 除 或 修改 一 个 慰 准 苞 数 时 ， 就 
震 罕 “个 新 的 编译 器 版本 。 然 而， 对 于 应 用 程序 员 而 言 ， 这 种 方法 会 是 非常 方便 的 ， 因 为 标准 半数 
将 总 是 可 用 的 。 

另 一 种 方法 是 将 所 有 的 标准 C 明 数 都 放 在 一 个 单独 的 可 重 定位 日 标 模块 中 
应 用 程序 员 可 以 把 这 个 模块 链接 到 他 们 的 可 执行 文件 中 : 

unix» gcc main.c /usr/lib/libc.o 

X ft 7 VE ER na Ce FERE REESE en CR SETA ЖЖЖ. НАН ЛКЕН 
的 便利 。 然 而 ， 一 个 很 人 的 缺点 荐 系统 中 每 个 可 执行 文件 现在 部 包含 着 一 份 标准 函数 集合 的 完全 上 拷 
N, 这 对 磁盘 空间 是 很 大 的 浪费 .( 企 一 个 典型 的 系统 上 , libc.a 大 约 是 8MB, 而 Шта 大 约 是 1МВ.) 
更 糟 的 是 ， 每 个 下 在 运 行 的 程序 部 将 它 白 己 的 这 些 晴 数 的 撕 贝 放 在 存储 器 中 ， 这 又 是 极度 浪费 存储 
髓 的 。 男 一 个 大 的 缺点 是 ， 对 任 条 标准 函数 的 任何 改变 ， 无 论 大 小 ， 部 要 求 库 的 开发 人 员 重 新 编 详 
EMELE RE ”个 非常 耗 时 的 操作 ， 使 得 标准 函数 的 开发 和 维护 变 得 很 复杂 。 

我 们 通过 为 每 个 标准 函数 创建 一 个 分 离 的 可 重 定位 文件 ， 把 它们 存放 在 一 个 为 大 家 所 知 的 日 录 
中 来 解决 其 中 的 一 些 问题 。 然 而 ， 这 种 方法 要 求 应 用 程序 员 显 式 地 链接 合适 的 日 标 模块 到 它们 的 可 
执行 文件 中 ， 这 古 “个 容易 出 错 而 六 耗 时 的 过 程 : 

unix> gcc main.c /usr/lib/printí.o /usr/lih/scanf.o ... 

静态 库 概 念 被 提出 来 ,以 解决 这 些 不 同方 法 的 缺点 。 相关 的 函数 可 以 被 编译 为 独立 的 日 标 模块 ， 
然后 封装 成 一 个 单独 的 静态 库 文 件 。 然后， 应 用 程序 可 以 通过 在 命令 行 上 指定 单独 的 交 件 名 字 来 使 


用 这 些 在 库 中 定义 的 函数 。 比 如 ， 使 用 标准 C 库 和 数学 库 中 哨 数 的 程序 可 以 用 形式 如 下 的 命令 行 来 
编译 和 和 链接， 


ип1х> gcc main.c /usr/lib/libm.a /usr/lib/libc.a ... 

ТЕЗЕ. БЕЙНАВИВЯЕЛЯІЛІК НЕЕ, Sx Lob r ПАЛУЯСИЕЙЯ TER UH 
ИАЛ» xm. SHRIEBIUEEOSSUPBEXI AT GENE. C 编译 器 驱动 程序 总 是 
传送 libea 给 链接 器 ， 所 以 前 面 提 到 的 对 libe.a 的 引用 是 不 必要 的 )。 

ТЕ Unix 系统 中 ,静态 库 以 一 种 称 为 看 档 archive) 的 特殊 文件 格式 存放 在 磁盘 中 。 存档 文 件 是 
一 组 连接 起 来 的 可 重 定位 日 标 文件 的 集合 ， 有 一 -个头 部 描述 每 个 成 员 日 标 文 件 的 大 小 和 位 置 。 存 档 





比如 说 libe,o 中 
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Ханда 标识。 为 了 使 我 们 对 库 的 讨论 更 加 形象 具体 ， 假 设 我 们 想 在 一 个 则 向 libvector.a 的 





静态 库 中 提供 图 7.5 PRIER. 

code/ünk/addvec.c сөйейіпі/тиітес.е 
1 void addvecí(int *x, int *y, 1 void multvecí(int *x, int YY， 
2 int *z, int п) 2 int *z, int n) 
3 { 3 { 
4 int 1; 4 int 1; 
5 2 
5 for {1 = 0; l< n: із) 6 for (jí = Ü; l < n; i++} 
7 zii] = x[i] + vli]: 7 z[i] = xfi] * vli]: 
8 } В } 

code/Tink/addvec.e 一 一 code/link/ multvec.c 

(a; addvec.o (b) multvec.o 
图 7.5 libvector.a ФВ ЕХ 


为 了 创建 该 库 ， 我 们 将 使 用 AR LR. WF: 


unix» gcc -c addvec.c multvec.c 
unix» ar rcs libvector,a addvec.o muitvec.o 


为 了 使 用 这 个 库 ， 我 们 可 以 编写 - ARAL ШМ 7.6 中 的 main.c， 它 调用 addvec ПЕРДЕ {和 包 
含 OGLO X vectorh 5E X, T. Hbvectora 中 例 程 的 函数 康 型 )。 


1 /* таїп2.с */ 

2 include <stdie.n>s 
3 hinclude "vector.h" 
4 

5 int xI[2] = (1, 2}; 
8 int yí2] = (3, 4); 
7 int 2121; 

B 

9 int maini] 

10  ( 

11 addyecix, y, z, 2): 
12 

13 return 0; 

14  ] 





这 个 程序 调用 了 静态 libvectora ЕР КЕ pas. 


printf("z = [жа sa3]xn", z[0], z[1]); 


图 7.6 示例 程序 2 


code/link/main2.c 


ocode/link/main2.c 


为 了 创建 这 个 可 执行 交 忻 ， 我 们 将 编译 和 链接 输入 立 件 main.o 和 libyectora: 


unix> gcc -02 -c mainz.c 


unix» gcc -static -o p2 main2.o ./libvector.a 


图 7.7 概括 了 链接 器 的 行为 。-static 参数 告诉 编译 器 驱动 程序 , 链接 器 应 该 构建 一 个 完全 链接 的 


Ж 4/74 


可 执行 目标 文件 , 它 可 以 加 载 到 存 桂 器 并 运行 , 在 加 载 时 泡 须 更 进一步 的 链接 了 。 当 链接 器 运行 时 ， 
ЗЕ addvec.o 定义 的 addvec 符号 是 被 maino ЗІЛІ, ВТЕ Д addvec.o 到 可 执行 文件 。 因 为 
程序 不 引用 任何 由 multvec.o 定义 的 符号 , 所 以 链接 器 就 不 会 拷贝 这 个 模块 到 可 执行 文件 。 链接 器 还 
会 从 libc.a 拷贝 Printfo 模块 ， 以 及 许多 C 运行 时 系统 中 的 模块 。 

ЖҮ — mainz c vector 


Bits 
(cpp. Cel, ав) libvector.a libc.a ағ 


可 重 定 位 目标 文件 те? printf.o 


和 其 他 printf.o 18 H Т 
| — 链接 器 0d) | 


> ZAREN 
可 执行 目标 文件 


图 77 与 静态 库 链 接 


7.6.3 链接 器 如 何 使 用 静态 库 来 解析 引用 

虽然 静态 库 是 很 有 用 和 而且 重要 的 工 具 , 但 是 它们 同时 也 是 程序 员 迷 了 惑 的 淖 头 , 因为 Unix 链接 
器 使 用 它们 解析 外 部 引用 的 方式 是 令 人 困惑 的 . «ЖЕМИ ЙИ. ЕЖЕ АЛД ЕЕ ПЕ 
编译 器 驱动 程序 命令 行 上 出 现 的 相同 顺序 来 打 描 可 重 定 位 目 标 文件 和 存 峭 文件 ( 虹 动 程序 自动 将 
命令 行 中 所 有 的 .c 文件 翻译 为 .0 文件 。) 在 这 次 打 措 中, 链接 器 维持 一 个 可 重 定位 目标 文件 的 集合 
E， 这 个 集合 中 的 文件 会 被 合并 起 来 形成 可 执行 交 件 ， 和 一 个 未 解析 的 符号 (也 就 是 ， 引 用 了 但 是 
尚未 定义 的 符号 ) 集合 UU， 以 及 一 个 在 前 面 输入 文件 中 已 定 闵 的 符号 集合 DD。 初始 地 , E. U #i D 
都 是 空 的 。 

e 对 于 命令 行 上 的 每 个 输入 文件 f， 和 链接 器 会 判断 f 是 一 个 目标 文件 还 是 一 个 存档 文件 
(carchive)。 如 果 上 是 一 个 日 标 文件 ， 那 么 链接 器 把 了 添加 到 BE， 修 改 U 和 了 来 反映 上 人 中 的 
符号 定义 和 引用 ， 并 继续 下 一 个 输入 文件 。 

. 如 果 f 是 一 个 存档 文件 ， 那 么 链接 器 就 尝试 严 配 U 中 未 解析 的 符号 和 由 存档 文件 成 员 定 袍 
75. MORO FE АК А m， 定 义 了 一 个 符号 来 解析 U 中 的 一 个 引用 ， 那 么 就 将 m 
MAET, JFHEEREERAE CU 和 了 来 反映 凸 中 的 符号 定义 和 引用 。 对 存档 文件 中 所 有 的 成 
员 目 标 文件 都 反复 进行 这 个 过 程 ， 直 到 口 和 了 都 不 再 发 生变 化 。 在 此 时 ， 任 何不 包含 在 卫 
中 的 成 员 目 标 文 件 都 被 于 和 弃 ， 而 链接 器 将 继续 到 下 一 个 输入 文件 。 

. 如 果 当 链接 器 完成 对 命令 行 上 输入 文件 的 扫描 后 , U 是 非 空 的 ， 那 么 链接 器 就 会 输出 一 个 错 
误 并 终止 。 否 则 ， 它 会 合并 和 重 定位 EE 中 的 目标 文件 ， 从 而 构建 输出 的 可 执行 文件 。 

不 伴 的 是 ， 这 种 算法 会 导致 一 些 令 人 困扰 的 链接 时 错误 ， 因 为 命令 行 上 的 库 和 目标 文件 的 顺序 

非 党 重要。 如 果 任 命令 行 中 ， 定 义 一 个 符号 的 库 出 现在 引用 这 个 符号 的 目标 文件 之 前 ， 那 么 引用 就 
不 能 被 解 林 ， 链 接 会 撩 败 。 比 如 ， 考 忠 下 面 的 命令 行 发 生 了 全 人 么 ? 


unix- gcc -static ./libvector.a main2.c 
/tmp/cc8XE6Rp,o: In function 'main': 
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/Ктїр/ссӨхНЬЕр.с{.ех+0х15}: undefined reference to 'addvec' 


在 处 型 libyectora M. U 是 空 的 ， 所 以 没有 libvector.a 中 的 成 员 日 标 文件 会 添加 到 正中 。 因 此， 
对 addvec 的 引用 是 绝 不 会 被 解析 的 ， 所 以 链接 器 会 产生 一 条 错误 信息 并 终止 。 

大 才 库 的 一 般 章 则 是 将 它们 放 在 命令 行 的 结 星 。 如 果 各 个 库 的 成 员 是 相互 独立 的 一 ta F. A 
没有 成 员 引 用 另 一 个 成 员 定义 的 等 号 一 一 那么 这 些 库 就 可 以 以 任何 顺序 放置 在 命令 行 的 结 昆 处 。 

太一- 放 面 ， 如 果 库 不 是 相互 独立 的 ， 那 么 它们 必须 排 庆 ， 使 得 对 于 每 个 被 存档 交 件 的 成 员外 部 
引用 的 符号 s. 在 命令 行 中 至 少 有 一 个 s 的 定义 是 在 对 s 的 引用 之 后 的 。 比如， Ж сос 调用 libra 
和 libz.a 中 的 函数 ， 而 这 两 个 库 色 调用 libya FHRS ЯУ, Eds TUB libx.a 和 libz.a 必须 处 在 
liby.a РАТЕ 

unix» gcc Ёоо. с libx.a libz.a liby.a 

in As REO Sk. п] ив i DERE. ШП, W foo 调用 libxa THAR, EHE 
ЖД liby.a ТА. ІП libya 又 调用 libx.a 中 的 函数 。 那 么 libx.a 必须 在 命令 行 上 重复 出 现 ; 


unix» gcc foo.c libx.a liby.a libx.a 


作为 男 一 种 方法 ， 我 们 可 以 将 libx.a 和 libya 合并 成 一 个 单独 的 存档 文件 。 


ЖУ 7.3 

au b Жат UTR PS H AFiS, ab 表示 a 依赖 于 b， 也 就 是 说 b 定 头 了 一 
个 被 a 引用 的 符号 。 对 于 下 面 每 种 场景 ， 请 给 出 最 小 的 命 今 行 ( 也 就 是 一 个 会 有 最 少数 量 的 目标 广 
S Adr og dre), 使 得 替 态 链接 器 能 解析 所 有 的 符号 引用 

А. p.o ^ libx.a 

B. p.o 7 libx.a - liby.a 

C. p.o > libx.a = liby.a Ё liby.a > libx.a > p.o 


77 重 定 位 


一 旦 能 搂 器 完成 了 符号 解析 这 一 步 ， 它 就 把 代码 中 的 每 个 符号 引用 和 确定 的 -个 符号 定义 【也 
取 是 ， 它 的 一 个 输入 日 未 模块 中 的 一 个 符号 表 表 日 ) 联系 起 来 。 在 此 时 ， 链 接 器 就 知道 它 的 输入 日 
AIR КИЛ А THARAD. БЕЙИШ Ti ИЛИ Г, БАЙҒА, ЖӘЙ 
入 模块 ， 并 为 每 个 符号 分 配 运 行 时 地 址 。 重 定位 由 两 步 给 成 ; 
. 重 定位 节 和 符号 定义 。 在 这 一 步 中 , 链接 器 将 所 有 相同 类 型 的 节 合 并 为 同一 类 型 的 新 的 聚合 
Т. ЯШ, ЖИЛЕ data 节 被 全 部 合并 成 一 个 节 ， 这 个 节 成 为 输出 的 可 执行 目标 文 
忻 的 .data 市 。 然 厂 ， 链 接 器 将 运行 时 存储 器 地 址 赋 给 新 的 聚合 节 ， 赋 给 输入 模块 定义 的 每 
个 三 以 及 赋 给 输入 模 央 定义 的 每 个 符号 。 当 这 一 步 完成 时 ， 程 序 中 的 每 个 指令 和 全 局 变 
基部 有 惟一 时运 行 时 存储 器 地 址 了 . 
б 重 定位 节 中 的 符号 引用 。 在 这 一 步 中 ,链接 器 修改 代码 节 和 数据 节 中 对 每 个 符号 的 引用 ， 梗 
得 它 从 指 同 士 确 的 运行 时 地 址 。 为 了 执行 这 一 步 , 链接 器 依赖 于 称 为 重 定位 表 目 (relocation 
entry) 的 可 重 定 位 日 标 模 块 中 的 数据 结构 ， 我 们 接 下 来 将 会 描述 这 种 数据 结构 。 
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当 汇编 器 生成 一 个 目标 模块 时 ， 它 并 不 知道 数据 和 代码 最 终 将 存放 在 存储 器 中 的 什么 世 署 。 它 
也 不 知道 这 个 模块 引用 的 任何 外 部 定义 的 函数 或 者 全 局 变量 的 位 置 。 所 以 ， 无 论 何 时 汇编 器 遇 到 对 
i EA ESSI. ВЖЕ EXER (relocation entry )， 告 诉 链接 器 在 将 日 标 文 
忻 合并 成 可 执行 文件 时 如 何 履 改 这 个 引用 。 民 码 的 重 定 位 表 目 放 在 .relo.text 中 ， 已 初始 化 数据 的 重 
E SEX HAE relo.data Ф. 

图 78 展示 了 ELF 重 定 位 表 目 的 格式 。offset 是 需要 被 修改 的 引用 的 节 偏 移 。syrmbol 标识 被 修 
改 引 用 应 该 指向 的 符号 。type 告知 链接 器 如 何 修改 新 的 引用 。 


code/Tink/elfstructs.c 


l typedef struct { 

2 inL offset: /* offset of the reference to relocate */ 

3 int &ymbol:24,  /*symbolthe reference should point to */ 
4 type:8; /* relocation type */ 

5 р E1f32 Rel; 


code/Tink/elfstructs.e 


图 ”8 ELF 重 定位 表 目 
每 个 受 日 表示 一 个 必须 重 定 位 的 引用 。 


ELF E X Í 11 种 不 同 的 重 定位 类 型 , 有些 相当 隐秘 ,我 们 只 关心 其 中 两 种 最 基本 的 重 定位 类 型 ; 

e Е 386 PC32; 重 定 位 一 个 使 用 32 ( PC 相关 的 地 址 引用 。 回 想 一 下 3.6.3 W, 一 个 PC 相关 
地 址 就 是 距 程 序 计 数 器 PC》 的 当前 运行 时 值 的 偏 移 量 。 当 CPU 执行 使 用 PC 相关 寻 址 的 
指令 时 ， 它 就 将 在 指令 中 编码 的 32 位 值 如 上 PC 的 当前 运行 时 值 ， 得 到 有 效 地 址 《例如 ， 
call 指令 的 日 标 )，PC 值 通常 是 存储 器 中 下 一 条 指令 的 地 址 。 

* R386 32: EEA- ЕН 32 位 绝对 地 址 的 引用 。 通 过 况 对 寻 址 ，CPU 直接 使 用 在 指令 中 
编码 的 32 位 值 作为 让 效 地 址 ， 不 需要 进一步 修改 ， 


772 车 定位 符号 引用 
图 7.9 展示 了 链接 器 的 重 定位 算法 的 全 代码 ， 


1 foreach section s í 

2 foreach relocation entry r 1 

3 refptr = 5 + r.offset; /* ptr to reference to be relocated */ 

4 

5 /* relocate а PC-relative reference */ 

Б if (r.type == R i86 0832} { 

7 refaddr = ADDRís) - r.offset; /*ref'srun-time address */ 
8 *refptr = (unsigned) (ADDRí(r.symboli + *rafptr - refaddr]; 
9 | 

10 

11 /* relocate an absolute reference */ 

12 it (r.type == В 386 32) 


1i *refptr = (unsigned) (ADDR(r.symbol) + *refptr); 
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14 } 
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第 1 CERUR МАЕ Е АЛЛА ИН ХИН КЕЛЕН r ERARI. A TIERE RAE 
fh. ЖИП ДЕРТИ s E-TTL SR ИШ) УҢ т 是 一 个 类 型 为 Ef32_Rel 的 结构 ， 如 图 
28 тд. ЛУ, RIER ары, Еа АНЫ W RI ҚЫҚ J iTe ІЛ: 
(分 别 用 ADDR(SMII ADDR{I.symboD) 表 水 》)。 第 3 行 计算 的 是 需要 重 定位 的 4 他 节 引用 的 数 注 s 中 
的 地 址 。 如 果 这 个 引用 使 用 的 是 PERGA, MWA ERAR 5 一 9 行 来 重 定位 。 如 果 该 引用 使 用 的 
荐 绝对 可 址 ， 它 就 通过 第 113 行 来 重 定位 。 

ЖАНУ PC 相关 的 引用 

剖 想 我 们 在 图 了 .1 Ca) 中 的 运行 示例 ，maino 的 .text 节 中 的 mam 程序 调用 swap ЖЕЛ, ЙЕ? 
是 在 swap.o xk XI. KEE call 指令 的 反 汇 编列 表 ， 是 由 GNU OBJDUMP 工具 生成 的 : 

5: e8 tc ЕР ff ff call 7 «main«Jx7» —swap(); 
7: R i86 FC32 swap relocation entry 


从 这 个 列表 中 ， 我 们 汀 到 call ӨЛЕТІН 0x6 ph. H 1 ЕЛИМ ЕЕЕ 0xe8 和 随后 的 
32 地 引用 Охе C 二进制 40 组 成 ， 它 是 以 小 端 法 字 节 顺序 存档 的 。 我 们 还 看 到 下 一 行 显示 的 是 
ХИ КЕРН. (PR -下 ， 重 定位 表明 和 指令 实际 上 是 存放 在 目标 文件 的 不 同 节 中 的 ， 
OBIDUMP 工夫 为 了 方便 将 它们 显示 在 一 起 .》 间 定位 表 目 rf 出 3 个 域 组 成 : 


r.offset = 0х7 
r.symbol = swap 
r.tvpe = R 386 PC3Z 


НЕРВ TES ЕШ 0x7 处 的 32 位 PC 相关 引用 ， 使 得 在 运行 时 它 指 则 swap 
т. ВЕ, Б ав: 

ADDA (5) = ADDR(í.text) = Oxt0481b4 
ЖП 

ADDRi(r.symboi) = ADDR(swap) = Ox8048?c8, 

使 用 图 7.9 中 的 算法 ， 链 接 器 首先 计算 出 引用 的 运行 时 地 址 〈 第 了 行 》 


reladdr АГРЕ (91 + r.otffaet 


UxBO383D4 + Cx? 
üxg048ibb 


然后 ， 它 将 引用 从 当前 值 ( -4) (БЛ 0х9, GEHE EST STRIS swap ЖЕЛ CBS 8 fr); 


"refptr = (unsigned) (ADDR(r,symbol) + *refptr - refaddr) 
> (unsigaed) i0x80483c8 + l-4) - Dx80483bhl 
= {unsigned} 10х9) 


fi. fg SUN n BUT E b FR, can 指令 有 如 下 的 重 定 位 的 形式 ; 
30483ba: ев 08 00-00-00 call 8D01B2cB <кмар> мар); 
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在 运行 千 ,call 指令 将 存放 在 地 址 Ox 80483ba 处 , 当 CPU 执行 call 指令 时 ,PC НІН 0x80483bf, 
ЕПЗ ТЕ call 指令 乙 后 的 指令 的 地 址 。 为 了 执行 这 条 指令 ，CPU АЛТ ЕЕ ЛЖ: 

1. push PC onto stack 

2. PC <- PC + 0х9 = Ox80483bf + 0х9 = Ox80483c8 

E. ЕЙІН 条 指令 就 是 swap 程序 的 第 一 条 指令 ， 这 当然 就 是 我 们 想 蓝 的 ! 

你 可 能 查 知 道 为 什么 汇编 器 会 生成 can 指令 中 的 引用 的 初始 值 为 -4。 沪 编 器 用 这 个 值 作为 偏 移 
量 ， 是 因为 PC 总 是 指 问 当前 指令 的 下 一 条 指令 。 在 有 不 同 指令 大 小 和 编码 方式 的 不 同 的 机 右上， 
该 机 器 的 汇编 器 会 使 用 不 同 的 偏 移 量 。 这 是 -个 很 有 用 的 技巧 ， 它 允许 链接 器 透明 地 重 定位 中 用 ， 
很 壮 运 地 不 用 知道 某 - eg HET A. 

重 定位 绝对 引用 

ЕНИ 7.1 中 我 们 的 示例 程序 , swap.o 模块 将 全 局 指针 bufp0 初始 化 为 指 问 全 局 数组 buf 的 第 - - 
ЛЖ ETE: 

int *bufpO = &БиЁ [0]; 


内 为 bufpo 是 一 个 已 初始 化 的 数据 日 标 , 那么 它 将 被 存放 全 可 重 定 位 目标 模块 swap.o 的 ,data Ti 
中 。 因 为 它 被 初 怒 化 为 一 个 全 局 数组 的 地 址 ， 所 以 它 需 要 被 重 定位 。 下 面 是 swap.o 中 .data 1 Sci 
编列 表 : 

00000000 <butp0>: 

0: 00 00 DO 00 int *bufpÜü = &buf[Ü0]; 
0: R 386 32 but relocation encry 

我 们 看 到 .data 节 包 含 -个 32 位 引用 ，bufp0 指针 ， 它 的 全 为 x0。 重 定位 表 日 告诉 链接 器 这 是 一 

个 3 位 绝对 引用 ， 开 始 于 偏 移 和 0 处， 必须 重 定 位 恒 得 它 指向 符号 buf， 现 在 ， 候 设 链接 器 已 经 判定 : 


ADDRir.symbol) = ADDR (buf) = 0x8045454 
链接 器 使 用 图 7.9 中 算法 的 第 13 行 修改 了 引用 | 


*refptri [unsigned] (ADDR(r.symbol) + *refptr| 
(unsigned) 19х8049454 + 0} 


(unsigned) 10х8019454) 

在 得 到 的 可 执行 目标 文件 中 ， 引 用 有 上 下面 的 重 定位 形式 ， 

0804945c <bufp0>: 

804945с: 54 94 04 08 Relocated! 

已 而 言 之 ， 链 接 器 在 运行 时 确定 ， 变 量 bufp0 将 放置 在 存储 器 地 址 0х804945с 处 ， 并 用 被 初始 
化 为 0x8049454， 这 个 值 就 是 buf 数组 的 运行 时 地 址 。 

swap.0 模块 中 的 text TAR 5 个 总 对 引用 ， 都 以 相似 的 方式 进行 重 定位 (参考 练习 题 7.12). 
图 7.10 展示 了 最 终 的 可 执行 口 标 文件 中 被 重 定 位 的 .text 和 .data 节 。 


1 [| !f 


code/link/p-exe.d 
1 ПВ0483Б4 <та1п>: 


2 B0483D4: 55 push $ebp 
3 8048365: 89 es mov $esp,€ebp 


480 I Art 
хы | 


л gUAB3h?!: B3 ec 08 sub &йхВ,%евр 

5 80482Ва: ей 09 00 00 00 call 80483с8 «swaps swap[l: 
6 ВОЯ ЕЗБЕ! 31 сй ХОГ Aeax, tax 

J 804831: B$ ec moy tebp, tesp 

H Bü4Bici; Sd рор Бр 

9 B)4B3c4: c3 ret 

10 804815: 90 пор 

11 80483сё: 90 nop 

12 B$0481c7; 90 nop 


13  üHü4B3cB «swaps: 





14 80483c8; 55 push евр 
15 8$0481c9: Bb 15 5c 94 04 DB mov ÜxBO494b5c, tedx Gei *hufpa 
16 BU4B8i1CT: al 58 94 04 08 Шеш ПхХЕ043453, toax Get bur] 1] 
17 Ей48304: 89 ез mov Resp, *ebp 
1B 80483d6: c7 05 48 95 04 DR 58  movl $0x8049458,0xB04954B шр = 
Shuti | 
19 Е048314: 94 D4 ПН 
2D B0493eD: #9 ес тот tebp, teap 
21 НП483е2: Bb Da тоу [5edx), becx 
22 0493104: 89 02 ПУ Ұғах, (Фейк) 
23 80483e6: al 48 95 04 (8 mov ÜxB049548, *eàax Get *bufn? 
24 B0483eb: 89 08 mav becx, [*eax) 
25 8048364: 5d pop еър 
26 BDd8B3me: ci ret 
— — cixderlink/p-exe.d 
ба) GEETE ma 节 
—— | — gpude/link/pdata-exe-d.i 
1 08049451 cbuE»: 
2 8049454: 01 00 00 00 02 DQ 00 00 
1 DHD4945Cc «bufpüs: 
4 Н04945с: 54 94 04 08 Relocated! 
ee — eudeidink/pdata-ere-d.c 


(by E W i іма 节 
87.10 JATH p RAER. text sm dota 1 

lh C КЕНЕН 7,1 m, 

53874 

538 3 X ТИТО P fil n n. 

A. W 5 PFP RL умар htta Ber 2 iË ЗЕЯ фу? 

B. $ 5 frd t swap 6 f £ b| Ж ali E £ y? 

C. ЖБ 3p KAA. W. BT 3 text ТЕ Ox80483b8 处 而 不 是 Ox80483b4 Ab, ИЕ id 
WT. б 54те enmt xd sy 
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7.8 可 执行 目标 文件 


我 们 已 经 看 划 链 接 器 是 如 何 将 多 个 日 标 模块 合并 成 一 个 可 执行 目标 文件 的 。 我 们 的 己 程序 ， 开 
始 时 是 一 组 ASCII 文本 文件 ， 已 经 被 转化 为 一 个 二 进 制 文件 ， 且 这 个 二 进 制 文件 包含 加 载 程序 到 存 
悄 嚣 并 运行 它 所 需 的 所 有 信息 。 图 7.1 概括 了 一 个 典型 的 ELF 可 执行 文件 中 的 各 类 信 筷 。 


0 
将 连续 的 谱 忻 节 





只 读 存 储 器 段 〔 和 代码 段 ) 


Gai (BRR) 


不 加 载 到 存储 器 的 符号 表 
和 调试 信息 


图 7.11 RER ELF 可 执行 目标 文件 


可 执行 且 标 文件 的 格式 类 似 于 可 重 定位 目标 文件 的 格式 ，ELF 头 部 描述 文件 的 总 体格 式 。 空 还 
多 括 程 序 的 入 口 点 (entry point)， 也 就 是 当 程序 运行 时 要 执行 的 第 一 条 指令 的 地 址 。text、.rodata 
Kidata 节 各 可 恒定 位 目标 文件 中 的 区 是 相似 的 , 除了 这 些 节 已 经 被 重 定位 到 它们 最 终 的 运行 时 存储 
器 地 址 以 外 ，.init WENT -个 小 函数 ， 叫 向 _init， 程 序 的 初始 化 代码 会 调用 它 。 因 为 丰 执 行文 件 
是 完全 链接 的 【已 被 重 定位 了 )， 所 以 它 不 再 需要 .relo t. 

ELF 可 执行 文件 被 设计 为 很 容易 加 载 到 存 傅 器， 连续 的 可 执行 文件 的 组 块 〔chunks) 被 映射 到 
连续 的 存储 器 段 。 段 头 表 〈segiment header table) 搬 述 了 这 种 映射 和 关系。 图 7.12 展示 了 我 们 的 示例 
可 执行 文件 p 的 段 头 表 ， 是 由 OBIDUMP 显示 的 。 


code/linl/p-exe.d 
Read-oniy code segment 
l LOAD off Ox00000000 vaddr Ux08048000 paddr й0х08248000 align 2**12 
2 filesz 0х00000448 memsz 0х00000448 flags r-x 
Read/write data segment 
3 LOAD off 0х00200448 vaddr 0x08049448 бадаг 0xQ8049448 align 2**12 
4 filesz  0üx000000e8 memsz 0х00000104 flags rw- 
- code/lin/p-exe.d 


7.12 示例 可 执行 文件 P КЕЗІНЕ 
ШЕ: off: ЗНАЯ: vaddrpaddr: ЖЕНЕ; align: БН. Нег: ҢЕР BLAU); memsz: 存储 器 中 的 段 大 小 
flags: 运行 时 许可 。 
从 引 头 甫 中 ， 我 们 看 到 会 根据 可 执行 目标 文件 的 内 容 初始 化 两 个 存储 器 段 。 第 工行 和 第 2118 
诉 我 们 第 一 个 段 (代码 段 》 对 齐 到 一 个 4KB (22) 的 边界 ， 有 读 / 执 行 许可 ， 开 始 于 存 情 器 地 址 


482 417% 


(комик 2b, G ЕН Е Ao k 0x4438 ҒИ, БЕНЕН 3 a har НКЖРНЕІЗ; Ox448 个 全 
节 ， 基 中 包括 ELF ЖИ. ЖЖ ini. лея 和 .fodata Т. 

第 3 行 和 第 4 行 告诉 我 们 第 二 个 段 ORBE 禄 对 齐 到 一 个 4KB ШЖ. Жанға, НЕ 
ЕЕЕ. OxO8049448 4b. ШЫНЫН K ol (АНЫ FT. ЖЕ M or t'ini 0x448 ГЕНІН Uxe8 
“Елік. БЕН, INFE 0x448 SEE R dara Т/М. ЙГЕ ЛҮҮ Te TE BERE 
Mibi TE ERU bss 数据 ， 


79 加 载 可 执行 目标 文件 

EEIT RAT ttt р. ATELE Unix shell ін ТА ЕН ЖҮ: 

unix» ./р 

HA p 不 是 一 个 内 置 的 shell ie. PEEL shell 会 认为 IE— Turf Hes ІР, RUIT T 
ЕТИ PERO Dn SERE (loader) 的 操作 系统 代码 素 为 我 们 运行 之 。 任何 Unix EIFE SERI ER 
BR] execve КАЖ ЖИНИ. ПИПРНЕЯАВ РІНЕН “ЧЕН. nna Ra er Bd Hb X 
rri fau msc ДЕНЕ ИТМ Т. ЖИН Н ТЕНШ 58. W^ v5 (entry 
Poimt》， 来 运行 该 程序 。 这 个 将 程序 持 风 到 存储 点 划 运行 的 过 程 叫做 加 末 (loading). 

每 个 Unix 得 序 都 有 一 个 运行 时 存 由 跟 上 映像， 如 图 7.13 所 示 。 在 Linux KP., REBLE EM 
地 址 хас во ЛБ. ME ER E FEE FIC] F— T 4 再 对齐 的 地 址 钼 。 运 行 时 扒 在 接 下 来 的 证 ; 
写 段 之 后 的 第 一 个 4KB 对 齐 的 地 址 处 ， 并 通过 调用 тайос 库 往 上 增长 。! 我们 音 在 109 节 中 详细 描 
ME malloc НІҢ.) 开始 于 地 证 Ox40000000 站 的 有 是 为 共享 库 保 留 的 ， 用 户 拨 总 是 从 地 址 Ox TIT 
外 开始 ， 基 向 下 增长 的 (向 低 在 能 器 地 址 二 自 增 长 J。 从 栈 的 上 部 开始 于 地 址 0xe0000000 #Е HP EE 
АЖЕ НИ ЕНЕ? Cb АШ) КИНЕ ЇН, 
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(mcüesaeao Ë V ph fes [1 


ааа eot: 


коопе lies 


== Ф irh, 
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ПЕ as 18 47 НУ, ШЕШЕН 7.13 所 示 的 存储 器 映像 。 逢 可 执行 文件 扬 段 头 表 的 指 时 下 ， 加 载 
器 将 可 执行 文件 的 相关 内 容 找 贝 到 代码 和 数据 段 。 接 下 有 来， 加载 器 跳 转 到 程序 的 入口 点 ， 也 就 是 符 
Lx start 的 地 址 .在 _start 地 址 处 的 后 动 代码 (startup code) EA НАС ctrl.o PEE PW fi В 
C 程序 者 是 一 样 的 。 图 7.14 展示 了 启动 代码 中 特殊 的 调用 序列 。 在 从 ,text 和 .init 节 中 请 用 了 初始 化 
BERE. Bsp REUS] atexit 例 程 ， 这 个 程序 附加 了 一 系 刻 在 应 用 调用 exit 函数 时 应 该 调用 的 程序 。 
exit 图 数 运行 atexit 注册 的 鸯 数 ， 然 后 通过 调用 _exit 将 控制 返回 给 操作 系统 。 接 着 ， 启 动 代 码 调用 
应 用 程序 的 main 程序 ， 这 就 开始 执行 我 们 的 C КОГ. 在 应 用 程序 返回 之 后 ， 启 动 代码 调用 _exit 
程序 ， 它 将 控制 返回 给 操作 系统 。 


1 0х080480с0 < start»: /* entry point in text */ 

2 call libc init first ГЕ startup code in .text */ 

3 call init i* startup code m amt */ 

4 Call atexit 六 startup code in .text */ 

2 call main /* application main routine */ 
b call exit РЕ returns control to OS */ 

7 /* control never reaches here */ 


7.144 在 每 个 C 程序 中 crt1.0 启动 例 程 的 伪 代 码 
UE. ПЕК ТРКЕ menm. 
Xt. МЕНЕН ИНТЕ? 

我 们 对 于 加 载 的 描述 从 概念 上 来 说 是 准确 的 ， 但 也 不 是 完全 准确 。 为 了 理解 加 载 实 际 是 如 何 工作 
的 ， 笨 必须 理解 讲 程 、 虚 拟 存 情 器 和 存 鱼 器 喘 射 的 概念， 这 些 我 们 还 没有 加 以 讨论 。 当 我 们 在 后 面 第 
8 章 和 第 10 章 中 诅 到 这 些 概 念 时 ， 芒 们 将 重新 回 和 到 加 载 的 问题 上 ， 并 逐渐 向 你 搬 开 它 的 神秘 面纱 、 

对 于 不 够 有 出 心 的 读者 , 下面 是 甘于 加 载 实 际 是 如 何 工 必 的 一 沾 概述 :Unix 系统 中 的 每 个 程序 者 
运行 在 一 个 进程 上 下 文中 , 这 个 进程 上 下 文 有 自己 的 康 拟 地 址 室 间 , 当 shelli&fz-—/4- 4288. X shell 
进程 生成 一 沾 子 进 程 , 它 是 父 进程 的 一 个 复制 号. 子 进 程 通过 execve 系统 调用 启动 加 载 器 。 加 载 器 删 
веж, ИН Кл. ЖЕ. МЪНИ, МЕНАН ЕИ. 
DM SE RU bt se 8] P fy oni EUST pu Ж-Н K ХУН (сінік), 新 的 代码 和 教 据 段 被 初始 化 
为 可 执行 文件 的 内 容 . Жа, =Й ҤЕ) мап 地 址 ， 它 重 终 会 调用 应 用 的 main dui. f TEX 
部 信息 ， 在 加 载 过程 中 没有 任何 从 磁盘 到 存储 器 的 教 握 捞 见 。 直 到 CPU 引用 一 个 被 映射 的 虚拟 页 ， 
才 会 进行 撒 贝 ， 此 时 ， 提 必 桑 统 利用 它 的 页 面 调度 机 制 自动 将 页 面 从 磁盘 传送 到 存 售 器 


УН 7.5 

A. 为 什么 每 个 心 程序 都 需要 一 个 叫 艇 main €) dic? 

B. 89912 C 的 main 函 教 可 以 通过 调用 exit 或 者 执行 一 条 retum 语 自 ,或 者 两 者 都 不 做 ， 
而 程序 全 熟 可 以 正确 终止 吗 ? ЯН. 
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我 们 在 7.6.2 节 中 研究 的 静态 库 针对 的 许多 尊 题 是 应 用 程序 如 何 使 用 太 量 可 用 的 相关 冰 数 。 然 
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ІШ, SERRA EUER. ВАЛЕТА НАЕ, RETARA. ТАУН 
ПЕЕ SEED ORAR, {ЙАШ ЖЕ АТ АЕК Ba ñ, Fue ш АНДЫП 
的 程序 与 新 的 库 重 新 链接 。 

胃 一 个 问题 是 几乎 每 个 忆 程序 都 使 用 标准 LO 函数 ， 比 如 printf 和 scanf。 在 运行 时 ， 这 些 前 数 
的 代码 会 被 复制 到 每 个 运行 进程 的 文本 段 中 。 在 一 个 运行 50— 100 个 进程 的 典型 系统 上 ， 这 会 是 对 
稀少 的 存储 器 系统 资源 的 极 大 浪费 。( 存 储 器 的 -个 有 趣 属 性 就 是 不 论 -个 系统 中 有 多 人 的 仓储 器 ， 
它 总 是 一 种 稀有 的 资源 ， 磁 盘 空 间 和 厨房 的 垃圾 桶 同样 有 这 种 往 性 。) 

ЖЖЖ (shared library) 是 图 力 于 解决 静态 库 缺 陷 的 一 个 山 代 创新 产物 。 共 享 库 是 个 日 标 模 
块 ， 在 运行 时 ， 可 以 加 载 玫 任意 的 存储 器 地 址 ， 并 在 存储 器 中 和 一 个 种 序 链 接 起 来 。 这 个 过 程 称 为 
动态 链接 〔〈dynarmmic linking)， 是 由 一 个 叫做 动态 链接 器 〈dynamic linker 的 程序 来 执行 前 ， 

共享 库 也 称 为 共享 目标 〔〈shared object), Æ Unix 系统 中 通常 用 .so ЛЖ Ж Ел. 微软 的 操作 系 
统 大 车 地 利用 了 共 持 库 ， 它 们 称 为 DLL (动态 链接 库 )。 

夫 学 库 的 “上 共享” 在 两 个 方面 有 所 不 同 。 首 先 ， 革 任何 给 定 的 文件 系统 中 ， 对 于 一 个 库 只 有 一 
个 .so 文件 。 所 有 引用 该 库 的 可 执行 日 标 文件 共 党 这 个 .so 文件 中 的 代码 和 数据 ， 而 不 是 像 静 态 库 的 
内 容 那 样 被 找 员 利 肛 入 到 引用 它们 的 可 氛 行 的 文件 中 ， 其次， 在 存 情 器 中 ， 一 个 共享 库 的 .text BR 
有 一 个 副本 中 以 被 不 同 的 正在 运行 的 进程 共 革 ,在 第 10 草 我 们 学 习 虚 拟人 存储 器 时 将 更 加 许 细 地 讨论 
XX ^" REA. 

图 7.15 ЖЕ 了 图 7.6 中 水 例 程 序 的 动态 链接 过 程 。 为 了 构造 图 7,5 中 疝 量 运算 六 例 程序 的 共享 
B libvecetotso， 我 们 会 调用 编译 器 ， 给 链接 器 如 下 特殊 指令 : 

unix» gcc -shared -fPIC -o libvector.so addvec.c multvec.c 


mairz.rc vector. hA 





ЮЕ 
:Срр.сс1.а8) libe. so 
lihvector.ac 
JEE Н Е mainz.o 重 定 们 和 
Не 8 


А ВЕ BER 


Итни P 
{еҳестуе } 
НА л 


中 党 全 
аяшим ct 
R75 “用 共享 库 来 动态 链接 





libe. ss 
libvector.ac 
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-fPIC 选项 指示 编译 器 生成 与 位 置 无 关 的 代码 〔 下 - - 节 将 详细 讨论 这 个 问题 )。-shared 选项 指示 
链接 器 创建 一 个 共享 的 目标 文件 。 

一 旦 我 们 创建 了 这 个 库 ， 我 们 随后 就 要 将 它 链接 到 图 7.6 的 示例 程序 中 。 

unix- gge -0 p2 mainZ.c ./libvector.so 

这 样 就 创建 了 一 个 可 执行 日 标 文 件 p2, 而 此 文件 的 形式 使 得 它 在 运行 时 下 以 种 Libvectorso S 
接 。 基 本 的 思路 是 当 创 建 可 执行 文件 时 ， 静 态 执行 一 些 链接 ， 然 后 在 程序 加 载 时 ， 动 态 完成 链接 

认识 到 这 一 点 是 很 重要 的 :在 此 时 刻 ， 没 有 任何 libvectorso 的 代码 和 数据 节 被 真 的 措 贝 到 可 执 
行文 件 也 中 。 取 而 代 之 的 是 ， 链 接 器 拷贝 了 一 些 重 定位 和 符号 表 信 息 ， 它 们 使 得 运行 时 可 以 解析 对 
libveciorso 中 代码 和 数据 的 引用 。 

交加 载 器 加 载 和 运行 可 执行 文件 p2 时 ， 它 利用 7.9 节 中 讨论 过 的 技术 ， 加 载 部 分 链接 的 可 执行 
文件 p2. 接着 ， 它 注意 到 p2 包含 一 个 ,interp 节 ， 这 个 节 包 会 动态 链接 器 的 路 入 名 ， 动 态 链 村 器 本 
身 就 是 一 个 共享 日 标 ( 比 如， 在 Linux 系统 上 的 LD-LINUX.SO)。 加 载 器 不 再 像 它 通常 那样 将 控制 
传递 给 应 用 ， 取 而 从 之 的 是 加 载 和 运行 这 个 动态 链接 路 。 

然后 ， 动 态 链 接 器 通过 执行 下 面 的 重 定位 完成 链接 任务 ; 

е 重 定位 libc.so 的 文本 和 数据 到 某 个 存储 器 段 。 在 IA32/Linux 系统 中 ， 共 享 库 被 加 载 到 从 地 

ДЕ 0x40000000 开始 的 区 域 中 参见 图 7.13). 

* Hy libvectorso 的 文本 和 数据 到 另 一 个 存 情 器 段 。 

. 重 定 位 p2 中 所 有 对 由 libc.so 和 libvectorso 定义 的 符号 的 引用 。 

最 后 ， 动 态 链接 器 将 控制 传递 给 应 用 程序 。 从 这 个 时 刻 开 始 ， 共 享 库 的 位 置 就 固定 了 ， 并 晶 在 
程序 执行 的 过 程 中 都 不 会 改变 ， 
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到 此 刻 为 止 ， 我 们 已 经 讨论 了 在 应 用 程序 执行 之 前 ， 旭 应 用 程序 被 加 载 时 ， 动 态 链接 器 加 载 利 
链接 共享 库 的 情景 。 然 而， 应 用 程序 还 可 能 在 它 运 行 时 要 求 动 态 链接 器 加 载 和 链 楼 任意 共享 库 ， 而 
无 需 在 编 评 时 链接 那些 库 到 应 用 中 。 

动态 链接 是 一 项 强大 有 用 的 技术 ,下面 基 一 些 现实 世界 中 的 例子 ， 

e 分 发 软件 。 微 软 Windows 应 用 的 开发 者 常常 利用 共享 库 来 分 发 软件 更 新 、 他 们 生成 一 个 共 
享 库 的 新 版 本 ， 然 后 用 户 可 以 下 载 ， 并 用 它 蔡 代 当前 的 版 本 。 下 一 次 他 们 运行 应 用 程序 时 ， 
应 用 将 自动 链接 和 加 载 新 的 共享 库 ， 

. ЖАРАН Web 服务 器 。 许多 Web 服务 器 生成 动态 内 容 ， 比 如 个 性 化 的 Web ШИШ. ШЕЛ Ж 
МЛ но. 早期 的 Web 服务 器 通过 征用 fork 和 execve 创建 一 个 子 进程 ， 并 在 该 子 进程 
的 上 下 文中 运行 CGI 程序， 来 生成 动态 内 容 。 然 而 ， 现 代 高 性 能 的 Web 服务 器 可 以 使 用 基 
于 动态 链接 的 更 有 效 和 完善 的 方法 来 生成 动态 内 容 。 

其 思路 是 将 生成 动态 内 容 的 每 个 函数 打包 在 共享 库 中 。 当 一 个 来 自 Web 浏览 器 的 请 求 
到 过 时 ， 服 务 器 动态 好 加 载 和 链接 适当 的 娄 数 , 然后 直接 调用 它 , 而 不 是 使 用 fork 和 ехесуе 
在 子 进 本 的 上 下 文中 运行 网 数 。 上 数 会 一 直 缓 存在 服务 器 的 地 址 空间 中 ， 所 以 只 要 一 个 简 
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ЕНЕ ИЛЕ ЛЕ КИ САКЕ ЕИ iW k Т. АА CERE ККФ ЖЕГІН Km. 
gir— p, AAETH АЛЕ. ВА ЫЫ 8. СИЛОВА. 
% Linux 和 Solaris 这 样 的 Unix 系统 ， 为 动态 链接 器 提供 ” :个 简单 的 接口 ， 允 许诺 用 程序 在 
isir ШУЙ ЖЕ CHE ETE a 


include «dlfen. fi> 


void *dlopeniconst char *filename, int flag); 


ibd: ЖАУЫ Аы 1914884. oh 5 Null. 





dopen ЕЙ Jn d Ж EE t filename. Fi LAA КТІ, GLOBAL 35:831 M PAPER Sr filename 
Тары, ШИА du a] HU E PE REP rdynamie id ER. ЖАЛ, EUR IRI 
号 也 是 可 用 的 .flag 参数 必须 要 么 包括 ВТР NOW, ios h Ve E Ro BU REOS P RES ИЛИН. 
€ ДЕ RTLD LAZY Bus. Ж мама ды 这 两 个 
{ТН ж ^а) ША RTLD GLOBAL 标志 到 


:nciude «cd fen.h- 


void *dlsymiívoid *handle, char *symboli; 


fu ЖАЛЫ ЕНУ HAH, Жан) 5 Null. 


disym Ж A d — 7-38 А ТЕТ ТЕЕ АЈ ASAT AS S 
ski RE ИЩ. ТТ NULL. 


Hingi ude <ditfcn,h> 





Int dlelose (void *handle):; 





返 国 : mx» 0, ЖЕЗ 1. 
如 果 没 有 其 他 其 蛙 库 还 在 使 用 这 个 共 旦 库 ，dlelose К А ТЕ IE. 
$include «dltzn.h- 


const char *dierroriíivoid); 


返回: 如 果 前 面 对 dlopen、dlsym 或 diclose 的 调用 失败 ， 
则 为 错误 消息 ， 如 果 前 面 的 调用 点 功 ， 则 为 №. 





dlerror ВА [Ы Е, ТЕО АУЗ Н dlopen. disym 或 者 dielose 通 数 时 发 生 的 最 近 的 
错 民 ， 如 果 没 有 错误 发 生 ， 就 退回 NULL. 

7.16 展 汪 了 我 们 如 何 利 用 这 个 接口 动态 链接 我 们 的 libvector.so ЖЗ (H 7.5), ЖҮРЕЙІН 
PJ addvec 程 说。 站 编 讶 这 个 程序 ， 我 们 将 以 下 面 的 方式 调用 ОСС: 


unlx- gcc -rdynamic -O2 -o рі maing. -ісі 


e LL -———  --— ecode/link/dll.c 


Міпсілгіс zstdio.h- 
Kinclude «dlfcn.h- 


int x[2] = {1, 2}; 
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int y[2] = i3, 4}; 
int z[2]; 


int maini) 


i 





void *handle; 
void (*addvec)iint *, int *, int *, int): 
char *error:; 


!* dynamically load the shared library that contains addvec() */ 
handle = dlopení"./libvector.so", ЕТО LAZY): 
if i!handle) | 
fprintf(stderr, "sin", Шеггогі)); 
exitii: 
} 


i* get а pointer to ће addvec() function we just loaded */ 
addvec = dlsymíhandle, "addvec*); 


1f {terror = clerrorí()) !s NULL) Í 
tprintfístderr, "£s'in", error); 
ехіні1); 


} 


/* Now we can call addvec() just like any other function */ 
адачес (х, y, 2, 2); 
prirtfi"z = [$d *djWin", z[0], z[11); 


/* unload the shared library %; 

if (dlclose(handle) < O) ( 
іргітетізідект, "'&sin", dlerroríl); 
exit[l!; 


return J; 


code/Tink/dil. c 
716 一 个 动态 加 载 和 链接 共 享 库 libvector.so 的 应 用 程序 


Edi: AAEH Java KARO | 

Java 定 头 了 一 个 标准 调用 规则 ， 电 做 Java 本 地 接口 (Java Native Interface, INI), КЙ Java 
程序 谓 用 “本 地 的 " 已 和 Сен INI 的 基本 思想 是 将 本 好 C 函数 ， 比 如 说 foo, 编译 到 共享 库 中 ， 
比如 说 fonsa. 当 一 个 正在 运行 的 Java UR GB RU, foo 时 ，Java BARAHA Шореп 接口 (或 
ЖАЛТ Қ) 动态 链接 和 加 载 fooso, ЖЕ 4388 foo, 


7.12 


“与 位 置 无 关 的 代码 (РІС) 


共享 库 的 一 个 主要 日 的 就 是 允许 多 个 正在 运行 的 进程 共享 存储 器 中 相同 的 库 代 码 ， 因 而 节约 宝 
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贵 的 存储 占 的 资源 ， 那 么 ， 训 个 进程 是 如 何 共享 一 个 程序 的 个 拷贝 的 呢 ? 一 种 方法 是 给 等 个 共享 
库 分 取 一 个 事先 预备 的 专用 的 地 址 空间 组 块 (chunk), 然后 要 求 加 载 器 总 是 在 这 个 地 址 加 载 共 襄 闫 。 
虽然 这 种 方法 很 简单 ， 但 是 它 也 着 成 了 一 些 严 重 的 问题 。 首 先 ， 它 对 地 址 空间 的 使 用 效率 不 剖 ， 
为 即使 一 个 进 赵 不 使 用 这 个 库 ， 那 部 分 空间 还 是 会 被 分 配 出 来 。 第 二 ， 它 世 难 以 管理 。 我 们 将 不 得 
不 保证 没有 组 块 会 重 叙 。 每 次 涯 一 个 库 修 疏 了 之 后 ， 我 们 必须 确认 它 的 已 分 杞 的 组 块 还 运 合 它 的 大 
小 。 如 果 不 适 台 了 ， 我 们 必须 找 一 个 新 的 组 块 。 并 用， 如果 我 们 创建 了 个 新 的 库 ， 我 们 还 必须 为 
它 寻 找 罕 则 。 随 大 时 间 的 进展 ， 很 设 在 一 个 系统 中 有 了 成 百 个 库 和 各 种 版 本 的 库 ， 就 很 准 避 免 地 址 
罕 间 分 发 成 大 量 小 的 、 本 使 用 砚 交 林 再 能 使 用 的 小 洞 ， 甚 至 更 煤 的 是 ， 对 等 个 系统 而 言 ， 从 库 到 存 
鳍 器 门 分 配 者 是 不 同 的 ， 这 束 引 起 了 更 多 令 人 头痛 的 管理 阿 题 ， 

-种 更 好 的 方法 是 编 详 库 人 代码， 使 得 不 需要 链接 器 覆 改 库 代 码 ， 就 可 以 在 在 何 地 址 加 载 和 执行 
这 些 和 代码 。 这 样 的 代码 叫做 与 位 置 无 关 的 代码 (position-independent code, РІС). MEX GCC 使 用 
-fPIC 选项 指示 GNU ЕГЕН РІС (88. 

在 一 个 ІА32 系统 中 ， 对 同一 个 日 标 模 块 中 过 程 的 调用 是 不 需要 特 萄 处 理 的 ， 因为 引用 是 PC 相 
АН, Ся, MEOE РС 了 《参见 练习 题 7.4)。 然 而 ， 对 外 部 定义 的 过 程 调用 和 对 全 局 变 
其 的 引用 通常 不 是 PIC， 因 为 它们 部 要 求 在 链接 时 重 定位 。 


7121 РІС 数据 引用 

编译 器 通过 运用 以 下 有 趣 的 事实 来 生成 对 全 局 变量 的 PIC 引用 ， 无 论 我 们 在 存储 器 中 的 向 处 加 
载 一 个 日 标 模块 (包括 共享 日 标 模块 )， 数 据 段 总 是 分 配 为 紧 随 在 代码 段 后 面 。 因 此 ， 代 三 段 中 任何 
指令 和 数据 段 中 任何 变量 之 间 的 距离 者 是 个 运行 时 常量 ， 与 代码 段 和 数据 段 的 绝对 存储 器 位 置 是 
ERK. 

为 了 运用 这 个 事实 , 编译 器 在 数据 段 开 始 的 地 方 创 建 了 一 个 表 , 叫做 全 局 偏 移 量 表 (global offset 
table, GOT). GOT 包 售 短 个 被 这 个 日 标 模块 引用 的 全 局 数据 日 标的 表 日 。 编 译 器 还 为 СОТ 中 每 个 
RHEN 个 重 定位 记录 。 在 加 载 时 ， 动 态 链接 器 会 重 定位 СОТ 中 的 每 个 表 日 ， 使 得 空 包 含 正确 
的 绝对 地 址 。 每 个 引用 全 局 数据 的 目标 模块 都 有 Ж ПАН СОТ. 

焉 运行 时 ， 使 用 下 面 的 代码 形式 ， 通 过 GOT 间接 地 引用 每 个 全 局 变量 ， 
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Ll: popi %ebx; # ebx contains the current РС 
addl SVAROFF, %ebx # ebx points to the GOT entry for var 
movl (ЖеБх), %еах # reference indirect through the GOT 


movl (Жеах!), Xeax 


在 这 段 代 码 中 ， 对 Ll 的 调用 将 返回 地 址 (正好 就 是 popl 指令 的 地 址 》 压 入 栈 中 。 随 后 ，popl 
指令 把 这 个 地 址 弹出 到 %ebx 中 。 这 两 条 指令 的 最 终 效 果 是 将 PC 的 值 称 到 寡 存 器 名 ebx 中 。 

指令 addi 给 Webx 增加 -个 常量 偏 移 量 ， 悚 得 它 指向 СОТ 中 适当 的 表 目 ， 该 表 日 包含 数据 项 
的 绝对 地 址 . 此 时 ， 就 可 以 通过 包含 在 %ebx 中 的 СОТ 表 目 间接 地 引用 全 局 变量 了 . 在 这 个 示例 中 ， 
Ж том 指令 (间接 地 通过 СОТ) 加 载 全 局 变量 的 内 容 到 寄存 器 %eax П. 

PIC 氏 码 有 性 能 缺陷 。 现 在 督 个 全 局 变量 引用 需要 五 条 指令 而 不 是 一 条 ， 还 需要 一 个 额外 的 对 
СОТ 的 存储 器 引用 。 而 且 ，PIC 代码 还 要 用 一 个 额外 的 寄存 器 来 保持 GOT НИН, CAFTA 
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寄存 里 立 件 的 检 器 上 ， 这 不 是 一 -个 大 问题 。 然 而 ， 在 寄存 器 供应 不 足 的 1432 系统 中 ， 即 使 失掉 一 
^ РЕН ЖОЙ БЕ Ce ЯР. 


7122 PIC 函数 调用 
PIC 代码 当然 可 以 用 相同 的 方法 来 解析 外 部 过 程 调用 ， 


call 11 

11:рор1 $ebx: # ebx contains the current РС 
addl ZPROCOFF, &ebx Я ebx points to СОТ entry for proc 
call *[$ebx) # call indirect through the COT 


不 过 ， 这 种 方法 对 等 一 个 运行 时 过 程 亩 用 都 要 求 二 条 额外 的 指令 。 取而代之 ，BLF 编译 系统 使 
M-P ARKH. AERAR E, (azy binding)， 将 过 程 地 址 的 纪 定 推迟 到 第 一 次 调用 该 过 程 对 。 
第 一 次 调用 过 程 的 运行 时 开销 很 大 ， 但 是 其 后 的 每 次 调用 都 只 会 花费 一 条 指令 和 - 个 间接 的 存储 器 
引用 。 

延迟 绑 定 是 通过 两 个 数据 结构 之 间 简 尘 但 又 有 些 复杂 的 交互 来 实现 的 ， 这 上 师 个 数据 结构 是 ; 
GOT 和 PLT (procedure linkage tables， 过 程 链 接 表 )。 如 果 一 个 目标 模块 调用 定义 在 共享 库 中 的 任何 
范 数 ， 那 么 它 就 有 自己 的 GOTH PLT. GOT 是 .data 节 的 一 部 分 ，PLT 是 .text 节 的 一 部 分 。 

图 7.17 展示 了 图 7.6 中 示例 程序 main.o 的 СОТ 的 格式 。 头 三 条 СОТ НЕННЯ: GOTO] 
包含 dynamic 自 的 地 址 ， 这 个 段 包含 了 动态 链接 器 用 来 绑 定 过 程 地 址 的 信息 ， 比 如 符号 表 的 位 置 和 重 
定位 信息 ，OGOTIH 和 包含 一 些 定 叉 这 个 模块 的 信息 ，GOT[2] 包 含 动态 链 搂 器 的 延迟 弓 定 代码 的 人 口 点 。 


08049574 0804965с | dynamic 节 的 地 址 
(8049678 400039(8 | 链接 器 的 标识 信息 


0804967с 40005944 | 动态 链接 器 中 的 六 口 点 
08049680 (804845a | PT 中 push! 地 址 (print? 
08040684 08048462 | PLT[2]rP pushi ҖАЕ Caddvec? 





87.7 可 执行 文件 P2 тА (СОТ) 
ВЕК 7.5 8n E] 7.6. 


定义 在 共享 日 标 中 并 被 maino 调用 的 每 个 过 程 在 GOT 中 都 会 有 一 个 表 目 ,从 GOTI3] 表 目 开 始 。 
对 于 示例 程序 ， 我 们 给 出 了 printf 和 addvec 的 СОТ #8, print 定义 在 libe.so P, Їй addvec 定义 
在 libvector.so tH. 

图 7.18 展示 了 我 们 示 便 程序 p2 的 PLT. PLT 是 一 个 16 字 节 表 目 的 数组 ， 第 一 个 表 目 PLTI0] 
是 一 个 特殊 表 日 ， 它 跳 转型 动态 链接 器 中 。 每 个 被 调用 的 过 程 在 РТ RR EH. А PLI] 
开始 。 在 图 中 ，PLTI 对 庶 于 pinti, PLTA EF addvec。 

PLT[0] 

08048444: ff 35 78 96 04 08 pushi 0x8049678 # push &GOT[1] 


d04844a: ff 25 7c 96 04 08 imp %0х804967с # jmp to *GOT[2](1inker!) 
8048450: 00 00 # padding 
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3048452: 00 00 Ж padding 


PLT[l] «printf» 

aü48d54: ТЇ 25 80 55 Dá 98 jmp —*O0x8043680 # jmp to *GOT/[3] 
804845а: $58 00 DO DD 00 pushl 50х0 ID for printf 
B04845E: 29 cü ff ff ff jmp 8048444 іпр to PLT[0] 


+ X 


PLT[2] «addvecs 

5048464; ІІ 25 BÀ 95 04 08 jmp  *Ox8045684 # jump to *GOT[4| 
ВО484ба: 6H 08 UD UJ 00 pushl $0х8 ID fcr addvec 
8048461: 29 du £f ff ff jp 8049444 # Jmp to PLT[IOJ 


Fe 


«олег БІЛ entriess 


图 7.18 可 执行 文件 Pz 的 PLT 
hio fea M 7,5 ШЕ 7.6. 


初 好 地 ， 在 程序 被 动态 链接 并 开始 执行 后 ， 过 程 printf 种 addvec ЕЛІНЕ ЕТАН) PLT 
RUTHR -条 指令 上 。 比 如 ， 对 addvee 的 调用 有 如 下 形式 ; 

p04eSbb: ей a4 fe ҒҒ ff call 8048464 <айдуес> 

“1 аййуес 第 “次 核 调用 时 ， 控 制 传递 到 PLT[2] 的 第 一 条 指令 ， 该 指令 通过 СОТА) т — ^ [8] 
EBH. wid. S СОТ 表 日 包含 相应 的 PET RAH pushl 表 蝇 的 地 址 。 岳 以 ，PLT 中 的 间接 
跳 轩 和 仪 仪 是 将 控制 转 穆 回 刘 PLTI2] 中 的 下 条 指令 。 这 条 指令 将 addvec 4 HA ID КАЖ Т. ЖЕ 
— Ф189 A РИТ], Ж GOTL1] 中 将 另外 一 个 标识 信息 的 字 压 入 栈 中 ， 然 后 通过 GOT[2)[B] FEB 
КЕД ЕНДЕП. ЖКН И ЕН ЖЫ addvec 的 位 置 ， 用 这 个 地 址 覆盖 СОТА), Я 
把 控制 传递 给 addvec。 

一 次 在 程序 中 请 用 addvec 本， 控制 像 前 而 一 样 传递 给 PLT[2]。 不 过 这 次 通过 GOT14] 的 问 接 
ЖЕН ЕНШ E aadvec， 从 此 刻 起 ， 惟 一 宪 外 的 地 销 就 是 对 间接 跳 转 的 存储 器 引用 。 


743 处理 目标 文件 的 工具 


TE Unix 系统 中 有 大 量 时 用 的 工具 可 以 帮助 你 理解 和 处 理 日 标 交 忻 。 特别 地 ，GNU binutils & JË 
Hem. WH n bls iy dc RR Unix FSL. 

€ AR; QIEBRAE,. ЖА. НЕ. ИШНДЕ. 

“ STRINGS: 列 出 ^ Bt УЛЫНА ЕТЕК S. 

* STR 及， 从 用 标 文件 中 删除 符号 表 信 息 ， 

• ММ: 列 出 一 个 日 标 奖 件 的 符号 表 中 定义 的 符号 。 

e SIZE: Vi Bie x ep TH X. 

* READELF: is 个 目标 文件 的 完整 结构 ， 包 括 ELF 头 中 编码 的 所 有 信息。 包含 SIZE И 
NM 愧 动能 。 

° OBJDUMP: 所 有 有 二进制 L.H Вр, 能够 显示 一 个 日 标 交 件 中 碑 有 有 的 信息 。 它 量 有 用 的 功能 
ж Xil sext 节 中 的 二进制 指令 。 
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Unix 系统 为 操作 共享 库 还 提供 了 ldd 程序 : 
е ldd: 列 出 -- 个 可 执行 文件 在 运行 时 所 需要 的 共享 库 。 


7.14 小 结 


链接 可 以 在 编译 时 由 静态 编 详 器 来 完成 ， 也 可 以 在 加 载 时 和 运行 时 库 动态 链接 器 来 完 成 。 链 接 
器 处 理 称 为 目标 文件 的 一 进 制 文件 ， 它 有 二 种 不 同 的 形式 : 呆 重 定 丛 的 、 可 执行 的 和 共 革 的 。 可 重 
ХАЈН X Pl HPP as pik ass ЕЛ -个 可 执行 的 目标 文件 ， 它 可 以 加 载 划 仔 情 器 中 并 执行 。 共 至 
БАХАР OUESO 是 在 运行 时 由 动态 链接 器 链接 和 加 载 的 ， 或 者 隐 售 他 在 调用 程序 被 加 载 和 开始 
HIH. KARE ИСЕ ЕЛЯ А dopen ЖНЖ. 

链接 器 的 网 个 主要 任务 是 符号 解析 和 重 定位 。 符 号 解析 将 日 标 文件 中 的 每 个 全 局 符 号 部 绑 证 钊 
—^ME -的 定义 ， 和 侧重 定位 确定 每 个 符号 的 最 终 存 入 器 地 址 ， 并 禾 改 对 孝 些 目标 的 引用 ，。 

НӘН Н GCC 这 样 的 编译 器 调 月 的 。 它 们 将 多 个 林 重 定位 日 标 文 性 组 合成 一 个 单独 
的 可 执行 日 材 文件。 多 个 日 标 文 件 可 以 定义 相同 的 符 写 ， 而 链接 器 用 来 悄悄 地 解析 这 些 名 处 定义 的 
规则 可 能 在 用 户 程 序 二 引入 的 微妙 错误 。 

多 个 日 标 文 站 可 以 被 连接 到 一 个 单独 的 静 态 库 中 。 链 接 器 用 库 来 解析 其 他 目标 模块 中 的 符号 引 
用 。 许 多 链接 器 通过 从 去 到 右 的 顺序 扫描 来 解析 符号 引用 ， 这 是 另 -个 引起 令 人 迷 感 的 链接 时 错误 
的 来 源 ， 

训 载 器 将 可 执行 文件 的 内 容 映射 到 存 情 器 ， 并 运行 这 个 程序 ， 链 接 器 还 可 能 生成 学 分 链接 的 可 
执行 日 标 艾 件 ， 这 样 的 文件 中 有 林 解 析 的 到 定义 在 共享 库 中 的 程序 和 数据 的 引用 。 在 加载 时 ， 加 载 
如 将 部 分 链接 的 可 执行 文件 映射 到 存储 器 ， 然 后 调用 动态 链接 器 ， 它 通过 加 载 共 学 库 和 重 定位 程序 
中 的 引用 来 完成 链接 任务 。 

被 编 详 为 位 置 无 关 代码 的 共享 库 可 以 如 载 到 任何 地 记 ， 也 吕 以 在 运行 时 被 多 个 进程 共 学 。 为 了 
加 载 、 链 接 和 访问 共享 库 的 函数 和 孝 据 ， 永 用 程序 还 可 以 在 运行 时 使 用 动态 链接 器 。 


参考 文献 说 明 

在 计算 .机 系统 文献 中 并 没有 很 好 她 记录 链接 。 因 为 链接 是 处 在 编 诺 跨 、 计 算 机 体系 结构 和 操作 
系统 的 变 义 点 上， 它 要 求 理解 代码 生成 、 机 器 语言 编程 、 程 序 实 钢化 和 虚拟 存储 器 。 它 恰好 不 落 在 
某 个 通常 的 计算 机 系统 专业 中 ， 因 此 这 些 领域 的 经 典 文 献 并 没有 纹 好 地 描述 它 。 然 而 ，Levine ЖІ 
车 提供 了 有 关 这 个 主题 的 很 好 的 - - 般 性 参考 资料 [47}。[35] 描 述 了 ELF 和 DWARF 的 原始 规范 
(对 .debug 和 .line 节 内 容 的 规范 说 明 }。 

围绕 二 进 制 翻译 〈binary translation) 的 概念 有 一 些 有 趣 的 研究 和 商业 活动 ， 二 进 制 翻译 包括 日 
标 文 件 内 容 的 语法 解析 、 分 析 和 修改。 二 进 制 翻译 有 三 个 不 同 的 目的 [46]， 在 一 个 系统 上 模拟 另 ， 
个 系统 ， 观 察 程序 行为 ， 或 是 执行 不 能 在 运行 时 执行 的 与 系统 相关 的 忧 化 。 ems. Hn 
VTune. Purify 和 BoundsChecker， 用 二 进 制 翻译 来 为 程序 员 提供 对 他 们 程序 的 详细 的 观察 。 

Atom 系统 提出 了 -- 个 肌 活 的 宙 制 ， 能 为 Alpha 可 执行 日 标 文件 和 共 学 库 担 供 侍 意 的 CC ра. 
Atom 被 用 来 创建 无 煞 种 分 机 工具 ， 包 括 跟 踪 过 程 调用 、 前 析 指 令 计 数 和 存储 器 引出 模式 、 模 拟 存 
情 如 系统 行为 ， 以 及 隔离 存储 器 引用 错误 。Etch[66] 和 EEL[461 在 不 同 的 平台 土 提供 了 人 致 相似 的 弓 
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ЯЕ. Shade 系统 利用 二 进 制 翻译 实现 指令 剖析 [1$]。，Dsynamo[2] 和 Dryninst[8] 提 供 了 一 些 机 市 ， 能 在 
运行 时 为 存 情 器 中 的 可 执行 文件 提供 测试 和 优化 。Smith 和 他 的 同事 们 致力 于 研究 程序 剖析 相 优 化 
HJ ME mE [91]. 
家 庭 作业 

76 € 

A518 РІ swap.c 函数 ， 它 计算 自己 被 调用 的 次 数 : 


1 extern int buf]: 

2 

3 Int *hbufpÜ = &buf[0]; 
4 static int *bufrpl; 

^ 

5 static void :ncrí) 

7 1 

B static int countzÜ; 
g 

10 саип ++; 

11 1 

12 

13 void swapt) 

là { 

15 int temp; 

16 

17 incrí): 

18 bufpl = &bu£[l]l; 
19 -emp = *bufpü; 
20 *bufpü = *bufpl; 
21 *bufpl = temp; 
22 0) 


对 于 每 个 swap.o 中 定 尺 和 引用 的 符号 ， 如 果 它 什 异 迪 swap.o 的 ,symtab 1 PSS EH W 
指出。 如 果 是 这 样 ， 请 指出 定义 该 符号 的 模块 (swap.o 或 main.o)， 符 号 类 型 (本 地 、 全 局 域外 部 ) 
以 及 它 在 模 央 中 所 处 的 节 .text、.data 成 .bss)。 
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不 改变 任何 变量 名 学 ,修改 7.6.1 小 节 的 bar5.c， 使 得 foose 输出 x A y 的 正确 信 (也 就 是 整数 
15213 和 15212 的 十 六 进 制 表 示 )。 

78 € 

在 此 题 中 , REF(SI) - -> DEF(x, Kk) 表示 链接 器 将 任意 对 模块 i 中 符号 x 的 引用 与 模块 & 中 符号 x 
的 定义 租 关 联 。 在 下 面 每 个 重子 中 ， 果 这 种 符号 来 党 明 链接 器 是 如 何 解 析 对 村 每 个 模块 中 用 个 定 
X Big REB. 如 虹 出 现 链接 时 错误 (规则 1)， 输 出 “ERROR”。 如果 链接 器 从 定义 中 性 意 选 择 一 个 ， 
那么 输出 “UNKNOWN”. 


А. 


/* Module 1 */ 
int maini) 

{ 

) 


/* Module 2 */ 
static int main-l; 
int р21) 

i 

} 


(а) REF(main.l) --» DEF _ d 
(b) REF(main.2) --> DEF! _ 
B. 
/* Module 1 */ /* Module 2 */ 
int X; double x; 
void maini) int p21) 
і { 


} 


(а) REF(x.1) --> DEFI 


} 


(Ы) REF(x.2) --> DEF( o) 
C. 
/% Module 1 */ /* Module 23 */ 
int x=1; double x-1.0; 
void mainí; int р2() 
I i 
} } 
|a) ВЕЕ[х.1) --» DEFI END 
(Б) REF(x.2) --» ПЕРІ e] 
79 € 


IE FHER € aAA Н RRR R: 


1 
2 
3 
4 


/* foob.c */ 
void p2(void!; 


int mainí! 
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р2{}; 

return 0; 
} 
/* barb.c */ 
include «stdio.h» 


char nain; 


void p2() 
{ 


М са |] Gy п jab (5 Ба єє < —1 ят іп 


1 


printf("Ox&xin", maini; 


HE Linux 系统 吓 编 译 和 执行 这 个 程序 时 ， 即 使 p2 不 初始 化 变量 main， 洗 也 能 打印 字符 出 


“0x5Sm” 并 正章 终止， 你 能 解释 这 一 点 吗 ? 


710 9 


а RI 表示 当前 路 径 中 的 日 标 模块 或 静态 库 ， 而 amb dra К ТЬ, Ж а 引用 了 一 个 
b 定义 的 符号 ， 对 于 下 面 的 每 个 场景 ， 给 出 使 得 静态 链接 器 能 够 解析 所 有 符号 引用 的 最 小 的 命令 行 
(也 吉 是 ， 含 有 最 少数 量 的 日 标 文件 和 库 参 数 的 命令 )。 


А.р.о — libx.a > p.o. 


B. p.o — liox.a ~ liby.aandliby.a > libx.a. 
C. p.o — libx.a — liby.a — libz.a andliby.a ~ libx.a — libz.a. 
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图 7.12 中 的 段 头 袁 了 明 数 据 自 占用 了 存储 器 中 0x104 个 字 节 。 然 而 ， 只 有 开始 的 Oxe8 S^ W 3 H 


可 执行 文件 的 节 。 是 什么 引起 了 这 种 差异 ? 
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图 7.10 中 的 swap 程序 包含 5 个 重 定 位 的 引用 。 对 于 每 个 重 定位 的 引用 ， 给 出 它 在 图 7.10 中 的 
行 写 、 它 的 运行 时 存储 器 地 址 和 它 的 从 。swap.o 模块 书 的 原始 代码 和 重 定位 表 卓 如 图 7 了 19 所 示 。 


7.10 中 的 行 号 


00000000 <вмар>: 


0: 55 
1: 8b 15 00 00 00 00 


іл H> шш 62 ES 


7: al 04 00 00 00 





push Зерр 

mov 0xQÜ, $edx get "bufpü- &hbuffO] 
3: R 386 52 bufpO relocation entry 
mov 0х4, %еах get bufl 1] 


链接 


6 H: R,386 32 buf 
7 c: 89 e5 тоу %еѕр, Фер 
8 е; с? 05 00 09 00 00 04 movl SO0x4,Ü0xÜ0 
9 15: CO 00 00 
10 10: R 38E_ 32 bufpl 
11 14: Қ 38E 32 buf 
12 18: 89 ec mov €$ebp,$esp 
13 la; 8b ба mov (*edx) , еси 
\й іс: 89 02 mov &eax, (&edx) 
15 le: 21 00 00 00 00 mov 0х0, %еах 
16 lf: А286 32 bufpl 
17 23: 89 ОЯ mov Фасх, (Жеах) 
18 25: ба рор ebp 
19 26: c3 ret 

图 7.19 ”练习 题 7.12 的 代码 和 重 定位 表 目 
7.13 999 


考虑 图 7.20 "Pf СЕНІМ ЕГИ GE DT Н ЮЙ. 

A. 确定 当 模 决 被 重 定 位 时 ,链接 器 将 修改 .text 中 的 哪些 指令 。 对 与 每 条 这 样 的 指令 ， 列 出 它 的 
重 定位 表 晶 中 的 信息 : ЗО. НИТУ А. 

B， 靖 定 当 模块 被 重 定位 时 ， 链 接 器 将 修改 .data 中 的 哪些 数据 日 标 。 对 于 每 条 这 样 的 指令 ， 列 
{ 它 前 重 定位 表征 中 的 信息 ， 节 偏 黎 、 重 定位 类 型 和 和 符号 名 字 ， 

呆 以 随便 使 用 诸如 OBJDUMP 之 类 鸭 工 其 来 帮助 你 解答 这 个 是 日 。 


1 
2 
3 
4 
5 
Š 
7 
В 
3 


10 


ы- t3 d — 


extern int p3í(void); 
int xz 1; 


int *Xp = kx; 


void p2(int y) { 
} 


void pli] í 
р2{*хр + pil): 


(a) СЩ 
00000000 <р2>: 
0: 55 push $ebp 
1: 85 e5 mov %езр,%ерр 
3: 89 ec mov %ерр,%евр 
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relocation entry 


bufpl = &bujf 1]: 


relocation entry 
relocation entry 


temp = БО]; 
bufl01=bufl 1]; 

get *bufpl—-&bufT!] 
relocation entry 
bufi i ]-iemp; 
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5 5: 5d рор зебр 

6 Б: c3 ret 

7 00000008 «pl»: 

Ë 8: 55 push tebg 

5 9: 89 es mov *tesp,£tebp 

10 b: £3 ec 08 sub SO0xB,*esp 

11 e: Bi c4 Т4 add SÜüxfftfffif4d,t*esp 
12 11: ей Fc ff ff ТІ call 12 «pl«Oxa» 
13 18: 89 cZ mov Жеах,+ебх 

14 18: al 00 со 00 00 moy Охо, *eax 

-5 id: 03 10 add [Жеах),%ейх 
6 1#: 52 push Беҳ 

17 20: ев fc ff ЁГ IÍ са11 21 <р1%йх19> 
18 25: 89 ec mov %ерр, ёеѕр 

19 A7; за pop %ерр 

20 ӘҢ: gå rat 


Lb? т] s fr B BC TEIL 市 


1 00000000 zx»: 
2 0; 01 00 03 00 
3 00000004 <xp>: 
4 à: 00 CO GO 00 
(cO ap RER H bs X PET] data T; 
图 /.20 8&2]: 7.13 的 示例 代码 
714 999 


考虑 图 721 CB] CARGA ЖС r T] ER GR 

A. (aC ARAS Е КУАТ, ЕЕ ЕНЕ OT text 中 的 哪些 捐 令 .对 于 每 条 这 样 的 指令 ， 列 出 它 的 
重 定 位 表 日 中 的 信息 : 季 惕 移 、 重 定位 类 型 和 符号 名 字 。 

B. 确定 当 模 的 被 重 定 位 时 ,链接 器 将 修改 ,rodata 中 的 哪些 数据 。 对 十 每 条 这 样 的 指令 ， 列 山 它 
的 盏 定位 表 目 中 的 信息 ， 节 偏 称 、 重 定位 类 型 和 符号 名 学 。 

可 以 随便 使 用 诸如 OBJDUMP 之 类 的 |. 具 来 带 助 你 解答 这 个 是 日 。 


int relo3iint valj 1 
switch (vall { 
case 100; 

returnívalb; 
case lüi: 


returnivals1?); 


— бї л ad ім М в 


Case 103: case 104: 
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8 returnival«i); 
3 сазе 105: 
10 тесогпіма1+5); 
11 default: 
12 returnivals5); 
13 ] 
14 ү 
(а) C 代码 
1 00000000 «relois: 
2 0: 55 push %ерр 
3 1: 89 e5 mow tesp,tebp 
4 3: 8b 45 ОН mov Üx8i€*ebp),$eax 
5 6: ва 50 9с lea Üxffffff9ci*eax),Ttedx 
É 9; 83 fa 05 сїр 50х5, fedx 
7 Ci 77 17 ja 25 «relo3s«0x25» 
8 е: ІІ 24 85 00 0) 00 00 jmp *ü0xC(, Фейіх,4) 
9 15: 40 inc eax 
10 16: ер 10 jmp 28 «relo340x2B» 
li 18: 83 cQ 23 add 590х3, Феах 
12 lb: eb üb jnp 28 <га103%9х28> 
13 ld: 8d 76 00 lea ÜxÜ0í(Xesi),t*esi 
14 20: 83 cO 05 add S05, вах 
15 23; eb 03 imp 28 <ге103+0х28> 
16 25: 83 cü 06 ааа $0x6,€*eax 
17 28: 89 ec mov $ebp,tesp 
18 2а: bd рор %ерр 
19 2р: C3 ret 


(b) "Жш Ж PE text 节 
1 This is the jump table for the switch statement 


à 0000 28000000 15000000 25000000 :8000002 4 words at offsets 0х0.0х4, Ox&, and Oxe 
3 0010 18000000 20000200 2 words at offsets 0х10 and 0x14 


(e) 可 重 定 位 日 标 文件 的 rodata ії 
图 7.21 练习 题 7.14 的 示例 代码 
715 999 
TG FX, F ШЇП ЖЕНЕ АЖА Hik C PED AERE Н. 
А. 在 你 的 系统 上 ，libhc 和 jibm.a 的 版 本 中 包含 多 少 目标 文件 ? 


498 87% 
B. gee —O2 产生 的 可 执行 代码 与 gce -02 -g 产生 的 不 同 吗 ? 
C. ШЖ D. GCC 坚 动 程序 使 用 的 是 什么 长 享 库 ? 
ЈЕ ЕЗ 


练习 题 7.1 ЖЖ 
这 道 练 习题 的 日 的 是 帮助 你 理解 链接 器 符号 和 С БЕБЕ ЮКА. А C 的 本 地 变量 
temp БАН. 


„к [messer [язан ВИ СТЕЛИ 
ES 





buf exiern mall.2 


练习 题 7.2 答案 
这 是 个 简单 的 练习 ,符合 你 对 Unix 链接 闫 解析 定义 在 一 个 以 上 模块 品 的 全 局 符号 时 所 使 用 规 
则 的 理解 。 理 解 这 些 规则 可 以 帮助 你 避免 一些 讨厌 的 编程 错误 。 
六 ,链接 器 选择 定义 在 模块 | 中 的 强 符 号 ， 而 术 是 定义 在 模块 2 中 的 晨 符 对 《规则 2) 
(a) REF(mair.l) --» DEF(main.1) 
(b) REF(main.2] --» DEF(main.l) 
B. 这 是 一 个 错误 ， 因 为 每 个 模块 都 定义 了 一 个 强 符号 man CRI 1. 
C. ЖЖ ТЕЕ UTER 2 中 的 强 符号 ， 而 不 是 定义 在 模块 1 中 的 弱 符 号 《规划 2). 


(а) БЕЕ{х.1} --» DEFíix,2) 
(b) REF(X.2! --> DEF x.2) 


练习 题 7.3 答案 

在 前 令 行 中 错误 地 放置 静态 库 的 位 置 是 造成 令 许 多 程序 员 述 惑 的 链接 器 错 娱 的 肖 所 原因。 然而 ， 
一 旦 你 理解 了 链接 器 是 如 何 使 用 静态 库 来 解析 引用 的 ， 它 就 相当 简单 易 情 了 。 这 个 小 练习 检查 了 你 
对 这 个 概念 的 理解 ; 

Á.gzc p.o libx.a 

B. gce p.o libx.a liby.a 

С.асс р.а libx.a liby.a libx.a 

练习 题 7.4 答案 

ROB ЖЕГЕН 7.10 中 的 反 汇 编列 表 。 在 此 ， 我们 的 自 的 是 计 你 练习 阅读 反 汇 编列 表 ， 并 检 
彰 你 对 PC 相关 寻 址 的 理解 。 

А. 第 5 行 被 重 定位 引用 的 十 六 进 制 地 址 为 0x80483bb. 

B. 第 5 行 被 重 定 位 引用 的 十 六 进 制 值 为 0x9。 记 住 ， 反 汇编 列表 给 出 了 小 庙 法 字 节 顺序 表示 的 
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引用 和 恒 。 
С. 这 里 的 关键 观察 点 是 无 论 链接 器 将 .text HEF EBR IR, SHH swap ВЛАВ 
的 。 因此, 无 论 链接 器 将 .text 节 定 位 在 何 处 ,因为 引用 是 一 个 PC 相关 地 址 , 所 以 它 的 值 都 将 是 0x9. 


练习 题 7.5 ЖЖ 

对 大 家教 程序 员 而 言 ，C 程序 所 际 是 如 何 启动 的 是 一 个 迷 。 这 些 问题 检查 了 你 对 这 个 后 动 过 程 
的 理解 。 你 可 以 参考 图 7.14 中 的 CC БӘЖ a E 

А. 每 个 程序 者 需要 一 个 main +. AA СЕЧА ТЕС 程序 而 诗 虱 是 相同 的 ， E36 
i 3I— АУЫ main HAX Е. 

B. ЖЖ main 以 return 语 名 终止 那么 控制 传 违 回 启动 程序 ， 访 程序 通过 调用 _exit FHR BR 
НЕ АЙ. b EH P SSH f return 语句 , 也 会 发 生 相 同 的 情况 。 如 果 main 是 以 调用 exit ІНІН, 
那么 екп 将 最 终 通 过 调用 _exit 将 控制 退回 给 操作 系统 。 在 所 有 三 种 情况 中 ， 最终 效果 是 相同 的 : Zi 
main 完成 时 ， 控 制 会 返回 给 操作 系统 。 
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302 第 B 章 


从 络 处 理 器 如 电 开 始 ， 直 到 你 断 电 为 止 ， 程 序 计 数 器 假设 一 个 达 列 的 值 
з, 7777, da] 

Аъ. 每 个 a, 是 某 个 相应 的 指令 n BM. BREM а, а, (DIE PR БІН (control 
transfer). XX FER] ТЫ de Pe si] TLLA b E ЖЕНЕ d (low of control 或 control flow). 

最 简单 的 -种 控制 流 是 一 个 “平滑 的 ”序列 ， 共 中 每 个 上 各 hadiri (memory) HARE 
MAL RER, RA RME E, BAE L. à nén. nas. VQ БИр 85 
熟悉 的 程 施 指令 造成 的 .要 想 使 得 程 言 能 够 对 由 程序 变 昕 表示 的 因 部 的 程序 状态 中 的 变化 做 出 友 应 ， 
这 些 指令 是 必要 嵌 机 制 ， 

但 是 系统 筷 必 须 能 够 对 系 练 状态 的 变化 俱 出 反应 ， 这 些 系统 状态 不 是 被 内 部 程序 变 昌 捕获 的 ， 
闪 半 也 不 一 定 野 和 程序 的 执行 相关 。 比 如 ， 一 个 全 件 定时 器 【或 计时 器 ) ДЕШ ЫНЫ, АТУ 
НЯЦААВ, BLU ронд, DANCER CEA RR HS Pelea asti Kalis, PAIR. 
АЯБА: ATARE, BUERE ТИНЕ УАН ЫН HI. 

HUU ИЕ fe Fea К^ ЖА ЖАПА ЛА CH RES ЖПД ЕСЕ 
(exceptional control flow, ЖЖ). ЕСЕХЕЛІНЕЛ ЖЕН ЕТЕ. ШШ. AR E, i 
fr RISUS dur oc E SE MR ШЕЕ АКАР, RERA REOR КН ЫН УДЫ 
М-Р я КАРЕ. dE. —Tut En DUAE МЕЗІ — ERE, ІП 
接收 者 会 将 控制 突然 转移 到 它 的 “个 信 身 处 下 程序 。 个 程序 可 以 通过 回避 通常 的 栈 规则 ， 并 执行 
A HAE Ж ГЕ PESCE AE AK gur ЖЕ АН d МАМ. 

作为 程序 员 ， 理 解 ECF ЗП ЖЕШ, А ЈА: 

+ 理解 ECF 将 帮助 你 理解 重要 的 系统 概念 . ECF 是 操 作 系统 用 来 实现 VO. 进程 和 虚拟 存储 器 

(HEUS. 看 你 习 以 真 正 理解 这 些 重 束 概念 之 出 ， 你 党 须 理解 ЕСЕ. 

4 理解 ECF 将 帮助 体 理解 应 用 程 床 是 如 何 与 操作 系统 交 到 的。 应 用 各 序 通 过 使 用 一 个 叫做 陷 
P (trap) sk ER 888. (system call) 的 ECF， 症 操作 系统 请 求 服务 ， 比 如 ， 问 磁 开 写 数 
Ж. ҚИЯҒА ЖОН. ШЕ CAE, ARS RME E Ee. MERAH ERA 
RHEE. ЖЖЖ Ж CW HL АЕ Hi ДЕ ОСЕ Ж ДЕШИ (ЖАТ ЛУН ЇЧ 

« 理解 ECF 将 帮助 你 编写 有 起 的 新 应 用 程 床 。 操 作 系 统 为 应 用 程序 提供 了 强大 的 ЕСЕ 机 制 ， 
用 来 创建 新 进程 、 等 竺 进程 终止 、 通 知 其 他 进程 系统 中 的 异常 事 人 在 ， 以 及 检测 机 响应 这 些 
事件 。 如 果 你 理解 这 点 ECF 机 制 ， 那 么 你 就 能 用 它们 来 编 咏 诸如 Unix shell 和 Web 服务 器 
LX EBPTLI. 

+ BECHTER Rd tadi TE. 708 C++ 和 Java 这 样 的 语言 通过 ту, catch 以 及 

throw iE Ө) KERRI ЖАН. ЖЕНЕ AIAT RETE АНЖИАН СЕН, БШ 

WA IRL ЕШ О) Kw dins n. КАШЫ E … 种 应 用 层 ЕСЕ, СТАЖ 

setjmp ЖИ longjmp ра 9 ЕСЕН. ЕТА tE (E ЕЕ A I R EA a РОН FUR ШИП УС. 

fI Hg A. АНЕ ЕКПЕ ТИ УН UE {Ун Ыы АХСЕМЕЕНДЕЙЯ 

Наз 2] АК РЈУ Н ДЕШН RERAN. ВАНО, pon ШЕН Қ ЕСЕ 的 。 我 们 撕 述 存 

下 于 “小 计算 机 系统 中 所 有 层次 上 的 务 种 形式 的 ECF。 我 们 从 异常 开始 ， 蜡 常 位 于 使 件 和 摊 作 系统 
变 界 的 部 分 。 我 们 还 会 讨论 系统 调用 ， 它 们 是 为 庶 诈 程序 提供 到 井 作 系统 的 入口 点 的 异常 。 然 后 ， 
我 们 会 提升 抽象 的 层次 ， 描 述 进 程 和 信和 号， 它们 位 十 应 用 和 操作 系统 的 交界 之 处 。 报 后 .我 们 将 讨 
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论 非 本 地 踏 转 ， 这 是 ECF 的 一 种 应 用 层 形 式 ， 


81 异常 


异常 是 一 种 形式 的 异常 控制 流 ， 它 一 部 分 大 由 三 件 实现 的 ， 一 部 分 是 由 操作 系统 实现 的 。 因 为 
它们 有 “部 分 是 由 硬件 实现 的 ， 所 以 有 具体 组 节 将 随 系 统 的 不 同 而 有 所 不 同 。 然 而 ， 对 于 每 入 系 统 而 
тт, ЖА ЛӘРЕН» 4x 蔬 中 我 们 的 目的 是 让 你 对 异 营 和 异 营 处 理 有 一 个 КЕНГЕ, 
并 且 帮 助 消除 现代 计算 机 系统 的 一 个 经 常 令 人 感到 迷惑 的 方面 。 

ЖТ (exception) 就 是 控制 流 中 的 突变 ， 用 来 响应 处 理 器 状态 中 的 某 些 变化 ,图 8.1 展示 了 基 
本 的 思想 。 


应 用 程序 ЖАНЕ 


Sif Bx e odas ы 
ят 
处 理 









Rn dk [r] 
《可 选 的 ， 


图 8.1 FAREA 


REPE RH dep IO SERE ORO 徇 贞 了 从 应 用 程序 到 一 个 异常 处 理 程 序 的 突 发 的 控制 转 和 锣 【 -个 异常 )， 存 和 导 常 处 理 程序 完 
ЖАНДЫ, ЕЖЕН МАНІН НЕЕ ЕНІ. 


ЖЕНІП, ШК р КЕРЕ, ДАЕ ИТ НА La. ЖЖ 
Жағы, ДАБАА АНУ ЧЕ S.: 状态 变化 被 称 为 事 千 【eventy， 事 件 可 能 和 当前 指令 的 热 
行 自 接 相 关 。 比 如， 发 生 虚 拟 存 储 器 缺 页 、 算 术 江 出 ， 域 者 -- 条 指令 试图 除 以 零 。 另 -- 方 面 ， 事 件 
可 能 和 当前 指令 的 执行 没有 关系 。 比 如 ， 一 个 系统 定时 器 户 生 信和 与 或 者 - -个 UO 请 求 完成 。 

在 任何 情况 中 ， 当 处 理 器 了 稚 测 到 有 事件 发 生 时 ， 它 就 会 通过 一 张 叫做 异常 表 《exeeption table) 
的 跳 秩 者 ， 进 行 一 个 间接 过 程 调用 〈 蜡 常 )， 到 一 个 专门 设计 用 来 处 理 这 类 事件 的 棵 作 系 统 子 程 序 
一 一 异种 处 理 程 应 (exception handler). 

当 异 共处 理 程序 完成 处 理 后 ， 根 据 引 起 异常 的 事件 的 类 和 型， 会 发 生 以 下 三 神情 况 中 的 一 种 ; 

L 处 理 程 序 将 控制 返回 给 当前 指令 fur〔 当 事件 发 生 时 正在 执行 的 指令 )， 

2. 处 理 哥 序 将 控制 返回 给 Inext《 如果 没有 发 生 异常 将 会 执行 的 下 一 条 指令 )。 

3， 处 弄 程 序 党 止 被 中 断 的 程序 。 

8.1.2 节 将 讲述 关于 这 些 可 能 性 的 更 多 内 容 。， 

Xi. тЕЗЕКЯЯЖ 
Ct+ 和 Java 的 程序 员 会 注意 到 术语 “ 弄 常 ” 也 用 来 描述 由 Chio Tava УА catch. throw 和 try 语 
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站 的 形 去 提供 的 应 用 级 ЕСЕ. ЖАЛЕЛ, A DOLAR DN] “ӨР ж “Жї ЖК. 48 
是 这 通常 是 不 必要 的 ， 因 为 从 上 下 文中 就 能 名 很 清 整 地 知道 是 哪 各 含义， 


8.1.1 异常 处 理 

异 弟 可 能 会 礁 以 理解 ， 因 为 处 理 异 常 壳 要 而 什 和 软件 紧密 合作 。 很 容易 搞 混 哪个 部 分 执行 哩 个 
任务 ， 让 我 们 殉 详 细 地 来 看 看 价 件 和 软件 的 分 工 吧 。 

系统 中 各 能 的 每 科 类 型 的 中常 部 分 配 了 一 个 惟 的 非 负 束 数 的 异常 号 (exception number)。 这 
ЖЫН у ДЕ ЕДЕННЕН GI n ra, Ribes ЕНЕ ІРІ RER АН dE EM as 
四部 分 】 的 次 计 者 分 妈 的 。 前 者 的 示例 包括 被 害 除 、 该 页、 存储 器 访 岂 违例、 断 点 以 及 算术 涪 出 。 
后 音 的 小 例 包 所 系统 调用 和 和 来世 外 部 VO 设备 的 信和 号。 

在 系统 月 动 时 【 当 计 算 机 重启 巧 普 用 电 时 )， 把 作 系 统 分 配 和 初始 化 一 夏 称 为 异常 表 的 姚 转 表 ， 
[fX H kE ЯА k 的 处 理 程序 的 地 址 .网 8.2 展示 了 - 张 异常 表 的 招式 。 


RAE 0 的 代码 
异常 处 理 程序 1 的 代码 


异 第 处 理 程 序 2 FOOL 





掉 常 处 理 程 序 n-1 АЧ 


ГІШ 


882 异常 表 
па ЗКЕН, РАНКА К А СОЧ ЫЬ, 


WIZI ORRERI РЕНТГЕН», АВН АА ET -个 事 付 ， 并且 确定 了 相应 的 异常 
S к, ВВ, АЯ, ЛТА ЧАЕНА, Я Е П k, PSHHNORBERED 
TF. ӨЗЕКТЕН ЕТ ИЕ ЛЯУ ЯЕ З НЕ ДЕЕ НАНЕ. а аяа 
Ш, ЕЛЕНА C МОЦ RE 3 85 Cexception table base register) КЕК CPU 
寄生 器 里 。 
慎 前 类 似 于 过 程 调用 ， 但 是 有 一 些 重 要 的 不 同 之 处 ; 
* 过 程 调用 时 ,在 跳 转 到 处 理 程序 之 前 , ЯК ЯНА ЫЛЫ T. ТП. RR ЯШЕҢ, 
inm hp A Ehe ChS ENIMS. ВАЕ Р (ut 
不 女生 ， 将 会 在 当前 指令 后 执行 的 指令 )， 
° ЖЕ ЇЙ, “ 些 额外 的 处 理 器 状 芒 未 到 乒 是 , 在 处 理 程序 返回 时 ,重新 开始 被 中 断 的 程序 会 
肖 用 这 些 状态 。 比 如 ， 个 IA32 系统 将 包含 当前 条 件 码 的 EFLAGS 寄存 器 和 其 他 一 些 东 上 是 
IA HB. 
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о MERIA- CHA ЕНЕ БЭР ER, MARETH Gem) 都 被 正 到 内 核 栈 中 ， 而 不 是 讨 
到 用 户 栈 中 。 

e 异常 处 理 程 序 运行 在 内 核 模式 下 (823 1), 这 意味 看 它们 对 所 有 的 系统 资源 部 有 完全 的 访 

|] ЖОМ. 

HEFTER A ELHA НЕ ЕЕ ЕНЕ ен ЕРЙ. CERERERUT ABER [SHE 
之 后 ， 它 通过 执行 AERE “АТЫН” fw ПЕНА АЖЕН ЕРЕ. Ин? pha 2100 
ARS SR [e] AERE НУРЕ Ба о арлап, АКЕ ЛЯРЖ (823 Tr), ЖЖТЕП 
PAPH, КЕЖЕ ШЕЕ ERAT. 


异常 号 
(х4) HER 










FAE Bx Bnet. 





ROS d ER 6-8 | 

" REN 
8.3 ”生成 异常 处 理 程序 的 地 址 

ЕНН. 


812 异常 的 类 别 
异 带 可 以 分 为 四 类 ， 中断 Cinterrupt?). Fó ËR (trap), ЖЕН (Таш! 和 终止 (abort), EI 8.4 中 的 
表 对 这 些 类 列 的 属性 做 了 小 结 。 


CR ISIN £ E 


RR ПЕЯТ у BEREHAT- 5 
[A ЖЕНГЕ ИЕ ipg ЭРАНЫҢ? 
# | ^n fS d Pa 1); 不 会 返回 





84 异常 的 类 别 

ЗУ a e HAL ЙУ И UO ix D ELE. b| FE RAT -条 指令 的 方 接 产物 。 

中 斯 

中 断 是 异步 发 生 的 ， 是 来 自 处 理 器 外 部 的 ГО 设备 的 信号 的 结果 。 硬 件 中 断 不 是 由 任何 一 条 专 
门 的 指令 造成 因 ， 从 这 个 意 六 二 来 说 它 是 异步 的 。 和 硬件 中 断 的 异常 处 理 程序 常常 被 称 为 中 断 处 理 程 
Br (interrupt handler), 

图 8.5 概述 了 一 个 中 断 的 处 理 ，LUO 设 苦 ， 例 如 网 络 适配器 、 磁 盘 控 制 器 和 定时 器 芯片 ， 通 过 向 
处 理 器 心 片 上 的 一 个 管 脚 发 信号 ， 并 将 异常 号 放 到 系统 总 线 上 ， 来 触 发 中 断 ， 这 个 异常 号 标识 了 引 
iud ЕТ 6. 

在 当前 指令 完成 执行 之 前 ， 处 理 器 注意 到 中 断 管 脚 的 电压 变 高 了 ， 就 从 系统 总 线 读 到 异常 号 ， 
然后 调用 适当 的 中 靳 处 理 程 序 。 当 处 理 程 序 返 回 时 ， 它 就 将 控制 返回 笋 下 一 条 指令 〈 也 就 是 ， 如 果 
没有 长生 中 断 ,在 控制 流 中 会 在 当前 指令 之 后 的 那 条 指令 )。 结果 是 程序 继续 执行 ， 就 好 像 没 有 发 生 
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过 中 断 一 栏 。 


КАЛЯ КД СЕН. ШЕШ) 是 周 此 发 咎 的 ， 是 执行 当前 指令 的 结果 。 我 们 把 这 类 指 
令 叫 做 故 陆 指令 faulting instruction). 










(2) 并 当前 指令 完成 后 ， 


《1 在 当前 指令 的 ШЕШЕН 





4) 
sautar 79 Ира 
(4) ЕНЕ 
АЕ F Ae 
6 85 中 断 处 理 
中 断 处 理 程序 将 控制 返回 络 应 用 程序 控制 流 中 的 下 -条 指令 ， 


ед 

И ДАЖЫ. ERIA ANAR. ЖН ШЕТ Е, ЮКЕ ОТЕНЕЛЇ А 
2] К RS. ЮЕШ ЕТИП Е 6 HFE MIN Н К ARLE ЧЕНЕП. nur 
535 Д], 

H RTA ы S= n] АИЫ К, Dn Е tread)、 创 建 一 个 新 的 进程 (fork )、 加 载 
一 个 新 的 程序 (execve)， 或 者 终 由 当前 进程 (exit). Ж T LUPA XXE Ж ИІ А ЕЙІН, ЖШ 
如 提供 J НУЖА) “syscall n” 65, ЧНРЕНЖЖАЯЖН Жа 时， 可 以 执行 这 条 指令 ,执行 
syscall 指令 会 导致: :个 到 并 营 处 理 程序 拘 陷 阱 ， 这 个 处 理 程序 对 参数 解 玛 ， 并 请 用 适当 的 内 核 种 序 。 
图 8.6 概述 了 -个 系统 调用 的 处 理 ， 







{2) 控制 传递 
РА - 
ELLA syscall кН 
X Sa SF URL FH next (3) анан 
Bi 
(4) ЖШШЕ [E|] 
syscall КЕ? 


68.6 陷阱 处 理 
R5 Br Am АР ЫЫ [n] H EFFE b C PER 一 条 指令 。 

B. PERF АЛИН ЖА, WSB DOBA CUR Н E HER. ЖІП, НЫН АЕ Ж 
[8]. MORE ER БАТЕ А РАХ, Cuser mode) 中 ， 用 户 模式 限制 了 函数 叮 以 执行 的 指令 的 类 型 ， 
而 且 它 们 只 人 能 访问 与 调用 函数 相同 的 栈 。 系 统 请 用 运行 在 内 核 模 式 (кете! mode) H, ARRA I 
叶 系 统 调用 执行 指令 ， 并 访问 定义 在 内 校 中 的 栈 。8.2.3 首 会 更 详细 地 讨论 用 户 模式 和 内 核 模 式 。 
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ЖЕ 

故障 由 错误 情况 引起 ， 它 可 能 被 故障 处 理 程序 修正 。 当 一 个 破 障 发 和 时 ， 处 理 器 将 控制 转移 给 
故障 处 理 称 序 。 如 果 处 理 程序 能 够 修正 这 个 错误 情况 ， 它 就 将 控制 返回 到 故障 指令 ， 从 而 重新 执行 
它 。 理 则 ， 处 理 程 序 返 叫 到 内 核 中 的 abort PF abon 例 程 会 终止 引起 故障 的 应 用 程序 。 图 8.7 概 
述 了 — MORBI BEER, 





Q B e 
(1) 当前 指令 第 处 是 程序 
vac tim 57 (32 НАЖА 
程序 运行 
a гы ktg pad Erde qa Ra cc k abort 
(4) ЖШТ EL 2 E S 


图 8.7 故障 处 理 
根据 故障 是 否 能 够 被 收复， 故障 候 理 程序 要 么 重新 热 行 故障 指令 ， 要 么 终止 。 


故障 的 一 个 经 典 示 和 例 是 缺 册 异常 ， 当 指令 引用 一 个 虚拟 地 址 ， 而 与 该 地 址 相对 应 的 物 斑 页 面 不 
在 存储 器 中 ， 因 此 必须 从 磁盘 中 到 出 时 ， 就 会 发 秆 这 种 故障 。 就 像 我 们 将 在 第 10 章 中 看 到 的 那样 ， 
一 个 页 和 面 茂 是 虚拟 存储 器 的 一 个 连续 的 块 《 描 型 的 是 4KB)。 缺 页 处 理 程序 从 磁盘 加 载 适 当 风 页面， 
然后 将 控制 返回 给 引起 故障 的 指令 。 当 指令 再 次 执行 时 ， 相 应 的 物理 页 面 已 经 驻 留 在 存储 器 中 了 ， 
指令 就 可 以 没有 故障 地 运行 完成 了 。 

终止 

终止 是 不 可 恢复 的 局 合 错误 造成 的 结果 一 一 典型 的 是 一 些 硬件 错误 ， 比 如 DRAM 或 者 SRAM 
世 补 损坏 时 发 生 的 奇 候 错 误 。 终 止 处 理 程 序 从 不 将 控制 返 加 给 应 用 程序 。 却 图 8.8 所 示 ， 处 理 程序 
将 控制 返回 给 一 个 abort Ж, RE Ж aK SH EP, 





(2) HE 
OD 发 生 致命 ; ср. ЕДЫ 
的 硬件 错误 77 (3) ail 
程序 运行 
ЛЕНИН ГЕННЕН к abort 
ҰҒЫ ЕЛЕС 
到 apcrt BIER 


58.8 БШШ 
终 目 处 理 程 岸 将 控制 传递 给 “个 内 核 abor W. АРЕНА А TOD E T. 


8.1.3 Intel 处 理 器 中 的 异常 

为 了 使 描述 更 具体 ， 计 我 们 来 看 看 为 nte 系统 定义 的 一 些 异 常 。 一 个 Pentium 系统 可 以 有 高 达 
256 种 不 同 的 异常 类 型 。 范 围 0-21 的 号 码 对 应 的 是 Pentium 体系 结构 定义 的 异常 ， 因 此 对 任何 
Pentium 类 的 系统 都 是 一样 的 。 ШИН 32—255 的 号 码 对 应 的 是 操作 系统 定义 的 中 断 和 陷阱 。 图 8.9 Ж 
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л Г “Ж. 

"QBEHIGLPHRE ELSE RE, А УД Е ОН Е HER ЕЕ KKTM, МЕНЕ 
法 情 误 CHEN 0). Unix ЖАНА ei ME p CAE. ТТЕ НЕЕ ЕРЕ. Unix shell Алы 
法 铺 谨 报告 为 “ 泽 点 异常 【Floaning exception)". 










пакт 
AC ESEZÜRE 
E T UL I 
a RE LIP | 
НІН? Pentium ФЕР 

Р RU ФЕ ЖЛ A ofr Mene. CREDO, ЖЖМ) BE НТ tke 
X id fr fi bh, abd D FLUE FHIR KE, Unix Jesse E ELE OSA I. Unix 
shell #k 71 468 D 8e — Re Di P Mog" БН (Segmentation fault) ". 

em ON uo Badii tA. ЖШ РЕНАН КИЯНЫН 
ІН ПП ЖИЕГИ A. Жк ЖЕТИНЕ e M I RAER 10 章 中 看 到 这 是 如 
Inf CERAT. 

机 器 检查 [异常 18) 是 在 故障 指令 执行 中 检测 到 致 会 的 硬件 异 误 时 爱 生 的 ,机 器 检查 处 理 程序 
М. 28 [арро Н ШЕ, 

ЇЕ A32 系统 上 , КАСА KRY INT n 的 陷阱 指令 来 提供 的 , 其 中 9 PPE RE nn 
256 TX H'iPIEH— TESI. НЕР, КЕННЕН 128 (0x80) 提供 的 ， 
mui. хата 

ша нр ЕК КЕЧЕЕ ТТТ ТТ A КЛ ТҮҮЛҮ, 
É “ғы” deg de “4”, TER 9C ER M E d E Rom s mi) umbrella il. 3 Тар 
жаты "B Oe h" AA АФРИ", АПА “АЖ aile GE, йл} 
ы БЕЛЛА 【中断 ) en] RU (А. НАБ). Eh md ios, 于 于 每 小 
系统 而 言 ， 基 训 的 概念 都 是 相同 的 ， 但 是 体 应 请 意识 到 一 些 制造 厂商 的 手册 客 几 “ЖАС Index 
kia ЖЕ КЕД T L L T $ 8 






31-127 
| — [2B (Dx8Q) 
|19--344 








8.2 进程 

秆 党 提供 基本 的 构造 块 ， 它 区 许 量 作 系统 提供 进程 (process) ІШЕ. 运程 是 计算 机 科学 中 最 
acd gir ma Pop SS 

AH HE FICUS LET- RM, RIOZHREBIT HER GUIDO EE ER] 
Mis trim ВЕ АЕ. ЖИПТЕ ЫШАНЫ ЕНШ. ШИШЕ RE EET P — 
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AH -条 地 执行 我 们 程序 中 的 指令 。 最 后 ， 我 们 程序 中 的 代码 和 数据 显得 好 像 是 系统 存储 器 中 惟一 
的 对 象 。 这 些 假象 都 是 坦 过 进程 的 概念 提供 给 我 们 的 。 

进程 的 经 典 定 叉 就 是 一 个 执行 中 程序 的 实例 。 系 统 中 的 每 个 程序 都 是 运行 在 某 个 进程 的 上 下 文 
(context) 中 的 。 上 下文 是 出 程序 正确 送行 所 需 的 状态 组 成 的 。 这 个 状态 包括 存放 在 存 情 器 中 的 程 
序 的 代 个 和 数据 、 它 的 栈 、 它 的 通用 目的 淋 存 器 的 内 容 、 它 的 程序 计数 器 、 环 境 变量 以 及 打开 广 任 
描述 符 的 集合 。 

每 次 用 户 通过 站 shell 输入 一 个 可 执行 日 标 文件 的 名 宇 ， 运 行 一 个 程序 时 ，sbhell 会 创建 一 个 新 
的 进程 ， 然 后 在 这 个 新 进程 的 上 下 文中 运行 这 个 可 执行 日 标 文 件 ， 应 用 程序 还 能 够 创建 新 进程， 且 
在 这 个 新 进程 的 上 下 交 中 运行 它们 自己 的 代码 或 其 他 应 用 程序 。 

关于 操作 系统 如 何 实现 进程 的 细节 的 讨论 超出 了 我 们 的 范围 取而代之， 我 们 将 藉 注 进程 提供 
给 应 用 程序 的 关键 抽象 : 

s 一 个 独立 的 还 辑 控制 流 ， 它 提供 一 个 假象 ， 使 我 们 觉得 我 们 前 程序 独占 地 使 用 处 理 器 。 

. 一 个 私有 的 地 址 空间 ， 台 提供 一 个 假 索 ， 人 司 我 们 觉得 我 们 的 程序 独 请 地 使 用 疗 情 怖 系统 ， 

让 我 们 更 深入 地 看 看 这 些 抽象 。 


8.2.1 逻辑 控制 流 

典型 地 ， 即 使 在 系统 中 有 许多 其 他 程序 在 运行 ， 进 程 也 可 以 向 每 个 程序 提供 一 种 假象 ， 好 像 它 
在 独占 地 合用 处 备 器 。 如 果 我 们 想 用 调试 器 单 步 执行 我 们 的 程序 ,我们 会 看 到 一 系列 的 PC (程序 计 
05) МИБ, KERE 一 地 对 应 于 包含 在 我 们 程序 的 可 执行 目标 详 忻 中 的 指令 或 是 包含 在 运行 时 动 
态 链接 到 我 们 程序 的 共享 对 象 中 的 指令 。 这 个 PC fW Pp Jul R E. 

考虑 一 个 运行 着 二 个 进程 的 系统 ， 如 图 8.10 所 示 。 处 理 器 的 一 个 物理 榨 制 流 被 分 成 了 二 个 还 辑 
流 ， 每 个 进程 一 个 。 每 个 竖 自 方向 上 的 列表 示 一 个 进程 的 逻辑 流 的 -部 分 。 在 这 个 例子 中 ， 进 程 
ABITI SJL 然后 是 B 开始 运行 到 完成 。 然 后 ，C 运行 了 一 会 儿 ， A 接着 运行 直到 完成 . 最 后 ， 
C 可 以 运行 到 结束 了 ， 





& 810 Sk 
进 各 为 每 个 程序 提供 了 ВЕ, ЕЕЕ ЕИ REGE. dS — EUR ESAE. ERER EM- A., 


图 8.10 网关 键 点 在 于 进程 是 轮流 使 用 处 理 器 和 的。 每 个 进程 执行 它 的 流 的 一 部 分 ， 然 后 被 抢占 
(preempted) :暂时 拌 起 )， 与 此 同时 其 他 进程 开始 执行 。 对 二 一 个 运行 在 这 些 进 程 之 -的 上 下 文中 的 
三 序 ， 筷 看 上 去 就 像 是 在 独占 地 使 用 处 理 器 。 疏 一 揭 反 面 例 证 是 如 果 我 们 精确 地 测量 每 条 指令 使 用 的 
时 间 ( 参 见 第 9 章 ), 我 们 将 发 现在 我 们 程序 中 - 些 指令 的 执行 之 间 , CPU 好 像 会 周期 性 地 停顿 (stall)。 
然而 ， 每 次 处 理 器 停顿 ， 它 随后 继续 执行 我 们 的 程序 ， 并 不 改变 程序 存储 器 位 置 或 寄存 器 的 内 容 。 

和 肯 而 言 ， 和 不 则 进程 相关 的 逻辑 流 并 不 影响 任何 其 他 进程 的 状态 ， 从 这 个 意 文 上 说 ， 每 个 逻 


310 I КЕФ 
ЖЕҢЕНИН. "eR BERTA KS CIPCO НІШ, ЕТОЙ, ЕНГІ. MEX 
ERRARTE АЖЕК; КИШЕН, ARANNA E. 

TERRE ЕЖЕН LMR КЕНЕ R 1E P REESE (concurent process), MAA 
ИНЕК АЛТ SEIT. ЕШ, PE ЕТО, 进香 A 和 是 就 是 并 发 运行 的 AM C ER. 8-3 
Ш. ВСНГ ЕТУ. НАВ 的 最 后 一 条 指 专 是 在 САТА Ic АТ. 

进程 和 其 他 进程 轮换 运行 的 概 塌 称 为 名 人 妊 大 《moltiuaking 1。 一 个 进程 执行 它 的 控制 访 的 一 部 
外 的 每 一 时 间 帮 叫做 时 间 片 【time slice). КІН, S£ frm ПИЙ A (ипе slicing). 


822 ШАШ 
进程 也 为 每 个 程序 提供 一 种 假象 ， 就 好 像 它 正在 独占 地 性 用 系统 地 址 室 间 。 在 一 痢 位 地 址 的 
机 器 上 ， 地 址 空间 是 于 个 可 能 地 址 的 集 童 ，0，1，…， 天 -1， 一 个 进程 为 督 个 程序 提 殿 它 自 己 的 条 
有 地 址 宣 间 。 一 般 而 言 ， 和 这 个 宇 间 中 基 个 地 址 相关 隧 的 那个 存储 器 字 节 是 不 蔽 杆 其 他 进程 读 或 者 
写 的 ， 从 让 个 意义 上 说 ， 这 个 地 址 空间 是 私有 的 ， 
尽管 型 每 个 私有 地 址 空间 相 甘 联 的 存储 器 的 内 容 一 般 是 不 同 的 ， 但 是 每 个 这 样 的 空间 孝 有 相同 
нні. ЕШ, PH BITE 展示 了 一 个 Linus ШЕРОВ Е зое [ау уц, ШІРІНДІ ЕНІН 
A PRF REX. NE. RQF. НИН ЕНЕ EHE. H 
hse fa Pr] На АН ЧЕТ КАБЕН HE (Him, SARRAT- ЗЕЙІНІН) DERI 
ЮЕШ. ИЕНІҢ, 
ах ТТ 
ЖҮЗІ? 
OxcO000000 "TM 


4— Vesp НГ 





üx40000000 | 


4— brk 


OxüBS2J4BDOO 


8.11 RH E) 


异常 控制 流 511 


8.23 用 户 模式 和 内 核 模式 

为 了 使 换 作 系统 内 核 提 供 一 个 无 局 可 击 的 进程 抽 银 ， 处 理 器 必须 提供 一 和 机 制 ， 限 制 一 个 应 用 
可 以 执行 的 带 令 以 及 它 可 以 访问 的 地 址 室 间 范围 。 

典型 地 ， 处 理 器 是 用 某 个 控制 寄存 器 中 的 一 个 方式 位 (mods bi 来 提供 这 种 功能 的 ， 访 寄存 
器 描述 了 进香 当前 享有 的 权力。 当 方 式 位 设置 了 时 ， 进 程 就 运行 在 内 核 模式 中 【有 时 叫做 超级 用 书 
模式 )。 一 个 运行 在 内 核 模式 的 进程 可 以 执行 指令 集中 的 任何 指令 , 并且 可 以 访问 系统 中 任何 存 情 器 
位 置 。 

方式 位 没有 设置 时 ， 进 程 就 运行 在 用 户 模式 中 。 用 户 模式 中 的 进程 不 从 洗 执行 特权 指令 
(privileged instmcetion?， 比 如 停止 处 理 器 、 改 变 方式 位 的 值 或 者 此 起 一 个 TO 操作， 也 椒 人 多 许 用 户 
怀 式 中 的 进程 直 读 引用 地 址 空间 中 内 核 区 内 的 代码 和 数据 ， 任 何 这 样 的 党 试 都 会 导 敏 臻 傅 的 保护 故 
障 。 用 户 程 序 必 须 通 过 系统 调用 接口 间接 地 访问 内 核 代 码 和 数据 ， 

一 个 运行 应 用 程序 代码 的 进程 初始 时 是 在 用 户 模式 中 的 。 进程 从 用 户 模式 变 为 内 核 模式 的 惟一 
方法 是 通过 诸如 中 断 ， 故 障 或 者 陷入 系统 调用 〈trapping system call) 这 样 的 异常 。 当 异常 发 生 时 ， 
控制 传 冲 到 异 肖 处 型 程序 ， 糙 理 器 将 模式 从 用 户 模 式 变 为 内 核 模式 。 椒 理 程序 运行 在 内 核 模式 中 ， 
当 筷 返回 到 应 用 代码 时 ， 处 理 器 不 把 模式 从 内 核 模式 改 加 到 用 户 模 式 ， 

Linux 和 Solaris 提供 了 - -种 聪明 的 机 制 ， 岂 做 Aproc 文件 系统 ， 它 允许 用 户 模式 进程 访问 内 核 数 
HERRAR. / proe 文件 系统 将 许多 内 核 数据 结构 的 内 容 得 出 为 一 种 用 六 程 序 可 以 读 的 ASCIE 文件 
的 层次 结构 。 比 如 ， 你 可 以 使 用 Linux /poc 文件 系统 找 出 一 般 的 系统 属性 ， 比 邵 CPU 类 型 
(fprocicpuinfo)， 或 者 某 个 进程 使 用 的 存储 器 段 (fproci<process id>/maps), 


8.2.4 上 下 文 切换 

操作 系统 内 核 利用 一 种 称 为 上 下 文 切 撞 (context swith) 的 绞 高 级 形式 的 异常 控制 流 来 实现 多 
任务 。 上 下 误 切 换 机 制 是 建立 在 我 们 在 8.1 节 中 已 经 讨论 过 的 那些 较 低 屋 异 常 机 制 之 上 的 。 

内 核 为 每 个 进程 维持 一 个 上 下 文 (context)。 上 下 六 就 是 内 核 重 新 启动 一 个 被 抢占 进程 所 需 的 状 
d. иш 一 坚 对 象 的 值 组 成 ， 这 些 对 象 包括 通用 目的 寄存 器 、 浮 点 寄存 器 、 程 序 计 数 器 、 用 户 找 、 
状态 寄存 器 、 内 核 栈 和 各 种 内 核 数 据 结 构 ， 比 如 描绘 地 址 空间 的 页 表 Сраре table)、 包 含有 关 当 前 
进程 信息 的 进程 表 《process table )， 以 及 包含 进程 已 打开 文件 的 信息 的 文件 表 (ike table). 

在 进程 执行 的 某 些 时 刻 ， 内 核 可 以 决定 抢占 当前 进程 ， 并 重新 开始 一 个 先前 被 抢占 的 进程 。 这 
种 决定 就 叫 敌 调度 scheduling)， 是 由 内 核 中 称 为 调度 器 (scheduler) 的 代码 处 型 的 。 当 内 核 选择 
一 个 新 的 进程 运行 时 ， 我 们 就 说 内 核 调度 了 这 个 进程 。 在 内 核 调度 了 一 个 新 的 进程 运行 后 ， 它 就 抢 
二 当前 进程 ， 并 使 用 一 种 称 为 上 下文 切换 的 机 制 来 将 控制 转移 到 新 的 进程 ， 上 下 文 切 接 可 以 ; OR 
存 当 前 进程 的 上 下 文 ， 名 恢复 某 个 先前 被 抢占 进程 所 保存 的 上 下 文 ， 团 将 控制 传递 给 这 个 新 恢复 的 
进程 。 

当 内 核 代表 用 户 执行 系统 调用 时 ， 可 以 发 生 上 下 文 切 换 。 如 果 系 统 调用 因为 等 待 某 个 事件 发 后 
而 阴 峙 ， 那 么 内 核 可 以 让 当前 进程 休眠 ， 切 换 到 另 一 个 进程 。 比 如 ， 如 果 一 个 read 系统 调用 请 求 一 
个 磁盘 访问 ， 内 核 可 以 选择 执行 上 下 文 切换 ， 运 行 另外 -个 进程 ， 而 不 是 等 待 数 据 从 磁盘 到 达 。 另 
一 个 示例 是 sleep 系统 调用 ， 它 显 式 地 请 求 让 调用 进程 休眠 。 一 般 而 言 ， 即 使 系统 调用 没有 阻塞 ， 
内 楼 也 可 以 决定 执行 上 下 六 切 换 ， 而 不 是 将 控制 返回 给 调用 进程 。 
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中 断 也 可 能 引发 二 下 文 切换 。 比 如 ， 所 有 的 系统 部 有 采种 产生 半期 性 乍 时 器 中 断 的 机 制 ， 划 开 
yg 1 毫秒 或 每 10 毫秒 。 每 次 发 生 定时 器 中 断 时 ,内核 就 能 判定 当前 进程 已经 运行 了 足够 长 的 时 
加 了 ， 并 切换 到 ЖИЙЕН. 

图 8.12 展示 了 一 六 进程 A 和 B 之 间 上 下 文 切换 的 示例 。 在 这 个 例子 巾 ， 韦 奶 地 ， 进 程 A E 
行 在 几 户 模式 中 ， 直 到 它 通 过 执行 read 系统 调用 陷入 到 内 核 。 内 核 中 的 陷阱 处 理 程序 请 求 来 目 磁 
ЕНІН DMA 传输 ， 并 在 磁盘 控制 器 完成 从 磁盘 到 存储 器 的 数据 传输 后 ， 鉴 求 磁极 中 断 处 理 
й. 


时 间 HEA | ЖЕ B 
i | 用 户 模式 
read --- 和 | ' . 
— ГЕ } йул; 
"RE i 用 户 模式 


从 read Ell — p а. Ні, ) КЕТИ 
| ВРА ҳ 


Ё 8.12 进程 上 下 文 切换 的 剖析 


任性 取 数据 到 用 - ' 段 机 对 较 长 的 时 间 《【 数 量 级 为 十 几 堂 秒 )， 所 以 内 核 执行 从 进 称 A 到 进程 B 
的 上 下文 切换 ， 而 不 是 在 这 个 间 获 时 间 内 等 待 ， 什 么 都 不 散 。 注 意 在 切换 之 前 ， 内 核 正 代 表 进 程 A 
蔚 用 己 模 式 下 执行 指令 。 在 切换 的 第 一 步 中 ， 内 核 代 表 进 种 A 在 内 核 模式 下 执行 指令 。 然 后 在 其 一 
时 刻 ， 它 开始 代表 进程 电 (仍然 是 内 核 模式 下 ) 执行 指令 。 在 切换 完成 之 后 ， 内 核 代表 进程 了 B 在 用 
让 模式 下 执行 指令 ， 

随后 ,进程 B 在 用 户 模 式 下 运行 一 会 儿 ， 直 到 磁 插 发 出 -个 中 斯 信 革 ， 胡 不 数据 已 经 从 磁盘 伎 
达到 了 行情 器 。 内核 判定 进程 B 已 经 运行 了 足够 长 的 时 间 了 ， 就 执行 一 个 从 进程 B И А 的 上 
下 文 切换 ， 将 控制 返回 给 进程 A 中 紧 随 在 read 系统 调用 之 后 的 那 条 指令 。 进 程 A 继续 运行 ， 吉 到 
ВЕ Е, ЖІНЗЕЖ, 
ЖЕ: ЖОН ЕС (pollution) 和 异常 控制 流 

-ANE ЖЫЛЛА ЛЕ T ЖЕЙ ер ИЖ E T Ж ЮЖ КЛ XSABHE x. 
如 果 当 前 进程 被 一 个 “中 断 ” 暂 时 中 断 ， 那 么 对 二 中断 处 理 程 序 来 说 高 速 缓存 是 冷 的 【cold ) '. de 
末 处 理 程序 从 主 在 中 访问 了 足够 多 的 表 目 ， 导 和 勾当 被 中 断 的 进程 继续 时 ， 高 可 经 存 对 它 来 说 也 是 冷 
的 了 。 在 这 种 情况 中 ， 我 们 就 说 (中 断 } 处 理 程 库 污染 (polte) 了 高 速 缓存 。 使 用 上 下 文 切换 也 


会 发 本 类 似 的 现象 . 当 一 个 进程 在 上 下 文 切 摘 后 继续 执行 时 ， 高 速 缓存 对 于 应 用 程序 而 言 也 是 冷 的 ， 
D E P T 


1 “ARRERA ЕВЕЕПИЕЕИЕЕЕ КЕЗ ІІ. —Át 
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83 ”系统 调用 和 错误 处 理 


Unix 系统 提供 了 大 量 的 系统 调用 ， 当 应 用 程序 想 向 内 核 请 求 服务 时 ， 比 如 读 取 一 个 文件 ， 或 者 
创建 一 个 新 的 进 理 ,， 都 可 以 使 用 这 些 系 统 调用 . 例如 , Linux 提供 了 大 约 160 个 系统 调用 。 和 输入 “man 
syscalls"， 你 将 得 到 完整 的 列表 。 

С 程序 通过 使 用 “man 2 intro ”里 描述 的 _syscall 宏 ， 可 以 直接 调用 任何 “系统 调用 ”"。 然 而 ， 
通常 二 接 调 用 “系统 谓 用 ” 既 不 必要 丸 不 值得 。 标 准 蕊 库 提 供 了 一 组 针对 最 常用 系统 调用 的 方便 的 
f (wrapper) 前 数 。 和 包 硝 园 数 将 参数 打 好 包 ， 通 过 适当 的 系统 调用 陷入 内 核 ， 然 后 将 系统 调用 的 
返回 状态 传递 给 调用 程序 ,在 我 们 下 面 章节 的 讨论 中 ， 我 们 把 系统 调用 和 它们 相关 的 包装 函数 可 互 
换 他 称 为 系统 组 函 教 ， 

"5 Unix 系统 级 函数 过 到 错误 了 时， 它们 现 失 地 会 返回 -1， 并 设置 全 局 整数 变量 ото 来 表示 什么 
出 错 了 。 程 序 员 应 该 总 是 检查 这 些 销 误 ， 但 是 不 幸 的 是 ， 许 多 人 部 忽略 了 错误 答 查 ， 铸 为 它 使 代码 
变 得 脐 肿 ， 而 且 难 以 读 展 ， 比 如 ， 下 面 是 我 们 调用 Unix fork 函数 时 如 何 检查 错误 的 ， 

1 if (ра = ГогК{)) < O) 1 

2 fprinzfí(stderr, "fork error: %в\п", strerror(errno)!; 

3 exit (D); 

4 | 

strerror iii Bi K, XE TAEA ermo 值 相 关联 的 错误 。 通 过 定义 下 面 的 错误 报告 

AA Cerror-reporting 名 nction)， 我 们 能 够 在 某 种 程度 上 简化 这 个 代码 ; 


i void ix errorichar *msg) /*unix-style error */ 

2 1 

3 fprinttistderr, "Ұз: %в\п", msg, strerroríerrno)); 
á exit {б}; 

5 ] 


АЛАЛ. JAA fork ИННА 4 fp f GET 2 37; 


i 11 (ipid = fork(;) < 0) 
2 unix errorí('fork error"): 


通过 使 用 错误 处 理 包装 《enorhandiing wrapper) 函数 ， 我 们 可 以 更 进一步 地 简化 我 们 的 代码 。 对 二 
一 个 给 定 的 基本 函数 foo， 我 们 定义 一- 个 具有 相同 参数 的 包装 函数 Foo， 但 是 第 一 个 字母 大 写 了 。 包 装 
藻 数 调用 基本 少数 来 检查 错误 ， 如 果 有 任何 问题 就 终止 。 比 如 ， 下 面 是 fork 基数 的 错误 处 理 包装 负数 ， 
рій t Forkívoid) 
{ 
pid t pid; 


1 
2 
3 
4 
5 11 (ipid = forki)) < D) 

6 unix error("Fork error"); 
7 reburr pid; 

8 

给 


} 
ЖУА hr, Fell Xf fork 的 调用 就 缩减 为 直行， 
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1 pid = Fork(): 

我 们 将 在 本 书 剩余 的 部 分 中 部 使 用 错误 处 理 包 装 所 数 。 它 科 允 许 我 们 保持 示例 代码 的 简洁 ， 而 
浆 不 会 给 你 错误 的 收 象 ， 认 为 允许 怨 略 错误 检查 ， 注 意 ， 当 我 们 在 本 书 中 谈 到 系统 级 随 数 时 ， 我 们 
息 是 用 它们 的 小 写字 枉 束 表示， 而 不 是 它们 人 写 的 包装 函数 书 来 表示 。 

Зер Unix 错误 处 理 以 及 本 书 中 使 用 的 错误 处 理 包装 函数 的 讨论 , 请 参考 附录 B. 包装 两 数 定义 
在 一 个 叫做 csapp.c f) X ЕР, VETE BUE XE Ë csapp.h 的 头 文 件 中 ， 为 了 便于 你 引用 ， 
附录 B 提供 了 这 些 文件 的 源 代 码 。 


8.4 进程 控制 
Unix Ж ЕТ KEA C 程序 中 操作 进程 的 系统 调用 。 这 —- p S e oc Eb EE BO BRL, ХЕ ORI 
如 何 使 用 它们 ， 
841 获取 进程 ID 
每 小 进程 部 有 一 个 惟一 的 止 数 ! Eq) 进程 ID (PID). getpid ASOR HARDA PID. getppid 
НІН ЕНЕРІ ОНАН, ШЕННОН ЫЫ). 
Binclude «unistd.h- 
*finclude «sys/types.h- 


pid t getpidivoid); 
pd t geLppidí(void); 





Аы; HAF S ESSE МР. 


getpid 和 getppid ERR]. TERA ра 1 HIRERE. F Linux 系统 上 的 types.h TEREA int, 


842 创建 和 终止 进程 
从 程序 员 的 角度 ， 我 们 可 以 认为 进程 总 是 处 于 下 面 三 种 状态 之 一 : 
e 运行 。 进 程 归 么 在 CPU 上 执行 ， 要 么 仕 等 待 被 执行 且 最 终 会 被 调度 。 
. 暂停 。. 进 往 的 执行 被 持 起 (suspended 1, 甘 不 会 被 调度 。 当 路 到 SIGSTOP, SIGTSTP. SIDTTIN 
或 者 SIGTTOU 信号 时 ,进程 吕 因 停 ， 并 且 保持 暂停 真 到 它 收 到 一 个 SIGCONT 信和 号， 在 这 
个 时 刻 ， 进 程 再 次 开始 运行 .〈 信 号 是 -种 软件 中 断 的 形式 ， 将 在 8.5 节 中 给 予 描述 。) 
. 终止 。 进程 水 过 地 停止 了 。 进 程 会 因为 二 种 原因 终止 :; HEEL 个 信和 号， 该 信号 的 默认 行为 是 
终止 计 程 ， 从 主 程序 返回 ， 调 用 exit 函数 。 
Kinclude zstdlib.h- 


vold exitíint staLus); 


ix dd LR ВНЕ, 


exit I TEE status Қ XAR IEEE ОН 种 设置 退出 状态 的 方法 是 人 失主 种 序 中 捞 回 4 
S B. 
AC XE FEAR КІЛЕМІ fork РАН — ED H ER 
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Kinclude «unistd.h- 
include «sys/types.h» 


pid t fork(void): 





返回 : PHRAO, SRAN- ШЕН РИ, ЖШ 5-1. 


新 创建 的 了 进程 几乎 但 不 完全 与 父 进程 相 崩 。 子 进程 得 到 与 父 进 程 用 户 级 处 拟 地 址 空间 相册 的 
(ERATA -HAU ARLA, WEA bs E. 堆 以 及 用 户 栈 。 子 进程 还 获得 与 父 进程 任何 打 
开 文 忻 摊 述 符 相同 的 找 贝 ， 这 就 意味 着 妆 父 进程 调用 fork 时 ， 子 进程 可 以 读 写 父 进程 中 打开 的 任何 
文件 。 父 进程 和 新 创建 的 气 进程 之 间 最 大 的 区 别 在 于 它们 有 不 同 的 PID， 

fork 函数 是 有 趣 的 (也 常常 令 人 迷惑 )， 因 为 它 只 被 调用 一 次 ， 却 会 返回 两 次 : 一 次 是 在 调用 进 
H ( 父 进 程 ) 中 ， 一 次 是 在 新 创建 的 子 进程 中 。 在 父 进程 中 ，ferk 返回 子 进程 的 PID。 在 子 进程 中 ， 
fork 返回 零 。 因 为 了 进程 的 PID 总 是 非 零 的 ， 返 回 慎 就 提供 一 个 明确 的 方法 来 分 辩 程 序 是 在 父 进 程 
还 是 在 子 进程 中 执行 的 。 

图 8.13 月 示 了 一 个 使 用 fork 创建 子 进程 的 父 进程 的 示例 ， 当 fork 调用 在 第 8 行 返回 时 ， 在 父 
进程 和 了 进程 中 x 都 有 值 1， 子 进程 在 第 10 行 增加 并 输出 它 的 x 的 撕 贝 。 相 似 地 ， 父 进程 华 第 15 
行 减 少 和 输出 它 的 关 的 拷贝 。 


code/ecf/fork.c 
1 Яіпсізііе "csapp.h" 
2 
E int maini) 
4 { 
5 pid t pid; 
6 int x = 1; 
° 
8 pid = Fork); 
9 if (pid == 0) { Æ child */ 
10 printfí"'child : x-£€dMn', ++х}: 
11 exit i0); 
12 ) 
13 
14 /* parent %/ 
15 printfi"parent: x-€$dWin". --х): 
16 exit {0}; 
17 } 

code/ecf/fork.c 


图 8.13 使 用 fork euge T Wraps 
当 我 们 在 Unix АЯК Lied iP FER, RIEA КІН Ж 


unix- ./fork 
parent: хаб 
child : xw=2 
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这 个 简单 的 例子 有 - АСА TO s 

* 调用 一 次 ,返回 两 次 。fork 函数 被 父 进程 调用 次 , 但 是 却 返 回 两 谈 一 一 一 次 是 返回 到 父 进 
程 ， 一 次 是 返回 到 新 创建 的 子 进 程 。 对 于 只 创建 -- 个 子 进程 的 程序 来 谤 ， 这 还 是 相当 简单 
的 。 在 是 含有 多 个 fork 实例 的 程序 可 能 就 会 令 人 迷 感 ， 和 需要 仔细 地 推 艾 T. 

s 并 发 执行 , 父 进 程 和 子 进 程 是 并 发 运行 的 独立 进程 . 内 纺 能 够 以 什 意 方 式 变 奉 执行 它们 韶 辑 
控制 流 中 的 指令 。 当 我 们 让 系统 上 运行 这 个 程 斥 时 ， 父 进程 先 完成 它 的 printf 语句 ， 然 后 是 
了 进程 。 然 而， 在 对 “个 系统 上 各 能 正好 相反 。 一 般 而 言 ， 作 为 程序 员 ， 我 们 无法 对 不 问 
进程 中 的 指令 交替 执行 做 任何 假 贡 。 

. 相同 的 但 是 独立 的 把 址 空间 ， 如 果 我 们 能 够 厅 fork ARE РЕА ДЕЕ РА or BD 5 

止 这 两 个 进程 ， 我 们 会 看 到 每 个 进程 的 地 址 空间 部 是 相同 的 。 每 个 进程 有 相同 的 用 卢 栈 、 
相同 的 本 地 完 量 值 ， 相 同 的 堆 、 相 同 的 全 局 变量 值 ， 以 及 相同 的 人 代码。 因此， 在 我 们 的 示 
和 例 程序 中 ， 当 fork 函数 在 第 8 行 返 回 时 ， 本 地 变量 x 企 父 进程 和 了 进程 中 都 为 1 然而， 因 
为 公 进 程 和 子 进程 是 独立 的 进程 ， 它 们 每 个 事 有 自己 的 私有 地 址 空间 。 后 惫 ， 父 进程 各 子 
进程 对 x 所 和 做 匆 任何 改变 都 是 独立 的 ， 不 会 反映 在 男 一 个 进程 的 存储 器 中 。 这 就 是 为 什么 
当 父 进程 和 子 进程 调用 它们 各 自 的 printf 前 数 时 ， 它 们 中 的 变量 x 会 有 不 同 的 值 。 

e 共享 文件 . 当 我 们 运行 水 例 程 序 时 , 我 们 注意 到 父 进 程 和 子 进 程 都 把 它们 的 输出 显示 人 在 屏幕 
t. 原因 是 了 于 进程 继承 了 父 进 程 所 有 的 打开 交 件 。 当 父 进 程 调用 fork 时 ，stdout 文件 是 被 打 
ЖЕ, ЗЕТА Д. ЕЛЕНЕ Dix EE, КЕЕНШНІРЖЗНІҢІҢ ЖЕНТ. 

如 果 你 是 第 -一 深 学 习 fok BOUE. ШЖ ДИНЛИ, H hir4 KE ig ЛҮ PAM ZI 
11%ААТТВУ НИЕ, ВЕНН АЛАМ fork 函数 的 执行 ， 

Жш, PH 8.14 (а) 中 的 程序 将 产后 多 少 输出 行 呢 ? 98.14 CO. 给 出 了 相应 的 进程 图 。 当 父 进 
BATARE -AORERE ~-… 个 }fork 应 数 时 , 它 会 创建 一 个 子 进 程 , 每 个 进程 前 调用 一 次 printf, 
所 以 程序 打印 两 个 输出 行 。 

现在 如 时 我 们 如 图 8&14 (с) 所 示 的 那样 请 用 fork 两 次 ， 会 怎样 呢 ? 就 像 我 们 在 图 8.14 (D 中 
看 到 的 那样 ， 父 进程 调用 fork 创建 -个 了 进程 ， 然 后 父 进程 和 子 进 程 部 调 用 fork, ОЕ 7 рл 
更 多 的 进程 。 因 此 ， 就 有 ГА 个 进程 ， 每 个 都 调用 Printf， 所 以 程序 就 产生 了 4 个 输出 行 。 

继续 油 这 个 思路 想 下去， 如 时 我们 瞩 调 用 fork 三 次 ， 如 图 多 14 (e) Ма, X EAE ДШ? 
就 像 我 们 从 图 8.14 (т) 中 的 进程 图 中 看 到 的 那样 ， - 共 会 有 8 个 进程 。 每 个 进程 调用 рии, BIO 
程序 就 产生 了 8 个 给 出 行 。 


1 #include "сьарр.ћ" 


2 
3 int maini) 
4 [ 
5 Forki); 
| hello 
5 printfí"hello'in"); 
exit(2); hello 
а ] fork 


(a) TIE fork ik th》 打印 内 个 输出 行 
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1 $sinclude "csapp.h" 








2 
3 int mairí) hello 
404 
5 Forki); 
b Forkí); 
7 printfí("hello!in"):; 
d exitiü); 
" : fork fork 
(c) RH fork 两 次 (d) 打印 四 个 输出 行 
helle 
1 #include "csapp. n" 
à 
3 int maini) 
і í 
2 Fork); 
Š Бәккіз; 
7 Forki}; 
8 printf("hello'in"); 
9 exiti0); | , 
10 } fark fork fork 
tel 调用 fork. 二 次 СТЕЛА НТ 
4814 fork Е 
A S 8.1 
考虑 下 面 的 程序 : 
code/ecf/forkprobO.c 
1 include "ceapp.h" 
2 
3 int main(í) 
4 { 
5 int x = 1; 
8 
7 iE (Fork() == С) 
R printfi"printfl: x-&din", ++x); 
g printfí"printf2: x-&din", --х}; 
10 exit (0); 
11 | 
code/ecj/forkprobÜ. с 


A. ҮЙЛЕРІН A? 
B， 父 进程 的 输出 是 什么 ? 
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练习 是 82 
下 面 的 程序 会 打印 务 耻 个 "hello" ddr? 


code/ecf/furkprabl.c 








1 finclude "csapp.h" 
2 
3 int maini) 
4 { 
5 int 1; 
5 
7 For (1 = D; 1 < 2; i++) 
B Forki}; 
5 printfí"hello!sn"); 
10 exit(0); 
11 } 
———— n coderecffforkprobl.c 
ЯЗ 83 
下 面 的 程序 会 打印 多 少 个 “heilo” 输 出 行 ? 
omo — — code/ecf/forkprobA.c 
1 #include "csapp.h' 
2 
3 void doit ií) 
4 1 
5 Forki}; 
6 Forki); 
7 printtl"helloxn"]; 
ñ return; 
9 
10 
11 int main!! 
13 1 
13 doit(); 
14 printt:"helloin"); 
15 exit (01; 
15 l 
vode/eclfforkproba. с 


8.43 回收 子 进程 
当 -个 进程 出 于 某 种 原因 终止 时 ， 内 核 并 不 是 立即 把 它 从 系统 中 清除 。 取 而 代 之 的 是 ， 进 程 被 
保持 在 -种 终止 状态 中 ， 直 到 被 它 的 父 进 租 回 收 【reapedy。 当 父 进程 回收 已 终 直 的 子 进 程 时 ， 内 核 
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将 子 进程 的 退出 状态 传递 给 父 进 程 ， 然 后 抛弃 已 终止 的 进程 ， 从 此 时 开始 ， 该 进程 就 不 存 作 了 ,一 
个 终 直 了 但 还 未 被 回收 的 进程 称 为 情 融 进程 (zombie)。 
况 注 ， 为 什么 已 线 沾 的 闻 进 程 称 为 僵 死 进 程 

在 区 间 待 说 中 ， 民 尸 是 活着 的 尸体 ， 一 种 半生 半死 的 实体 。 愉 死 进程 已 经 终止 了 ， 而 内 核 仍 保 
亡 着 它 的 某 些 状态 直到 父 进 程 加 怕 必 为 止 ， 从 这 个 意义 上 说 客 公 是 类 似 的 ， 

如 果 父 进程 没有 同上 疲 它 的 候 死 子 进程 就 终 上 小 了 ,那么 内 核 就 会 安排 mit 进程 来 回收 它们 。init 
进程 的 РТР 为 !， 并且 是 在 系统 初始 化 时 由 内 核 创建 的 。 长 时 间 运 行 的 程序 ， 比 如 shell Ж HE 
器 ， 总 是 应 该 回 收 它们 的 德 死 了 了 进程。 即使 恤 死 子 进 程 没有 运行 ， 它 们 仿 然 消耗 系统 的 存储 器 资 
«B. 

-个 进程 可 以 通过 调 月 waitpid ЖЕН ГН ЕЕЕ. 

#include «sys/types.h» 
#include «sys/walt.h-» 


pid t waltpidipid t pid, int *status, int options!; 
Яғ. eX. Ш РНЕ М, 4X WNOHANG， 则 为 0， 如 果 出 错 则 为 -1， 





waitpid 函数 有 点 复杂 。 默 认 地 《【 当 options=0 F), waitpid 挂 起 调用 进程 的 执行 ， 直 到 它 的 等 
待 集合 中 的 一 个 了 进程 终止 。 如 颗 等 竺 集合 中 的 一 个 进程 在 刚 调用 的 时 刻 就 已 经 终止 了 ， 那 么 
waitpid RINER. FRAIA, waitpid 返回 导致 waitpid 返回 的 终止 子 进程 的 PID, JF FU 
这 个 已 终 小 的 子 进 程 从 系统 中 去 除 。 

判定 等 待 混合 的 或 员 

SERERE дн pid 来 确定 的 ， 

• 如 打 pid>0， 那 么 等 竺 集合 就 是 一 个 单独 的 子 进 程 ， 它 的 进程 ID 等 于 pid. 

• ШЖ mid=-1， 那 么 等 待 集合 种 是 由 父 进程 所 有 的 子 进程 组 成 的 。 
旁 注 ， 在 进 牺 集合 上 的 等 待 

waitpid 函数 还 支持 其 他 类 型 的 等 待 案 合 ， 包 括 Unix 进程 组 ， 对 此 我 们 将 不 做 讨论 . 


E EOS 

可 以 通过 用 常量 WNOHANG 和 WUNTRACED 的 不 同 组 合 来 设置 options， 修 改 默认 行为 

e WNOHANG: 恕 果 没 有 等 徒 集 合 中 的 任何 子 进程 终止 ， 那 么 就 立即 返回 (返回 慎 为 0). 

* WUNTRACED: 挂 起 请 用 进程 的 执行 ,直到 等 特集 合 中 的 一 个 进程 变 成 终止 的 或 者 被 暂停 ， 
返回 的 PID 为 导致 返回 的 终止 或 暂停 子 进程 的 PID. 

* WNOHANGIWUNTRACED: 立即 返回 ， 如 果 没 有 等 待 集合 中 的 任何 子 进 程 停 让 或 终止 ， 那 
么 返 周 值 为 G0， 或 者 返 问 值 等 于 那个 被 停止 或 者 终止 子 进程 的 PED. 

КЕРІК ТИЕ ЈЕ Ж 

ЯЖ status 参数 是 非 空 的 ， 那 么 waitpid 就 会 编码 关 十 导 敏 返回 的 子 进 程 的 状态 信息 到 status # 

№. мал 包含 文件 定义 了 解释 status 参数 的 几 个 宏 ， 
e WIFEXITED(statusYy， 邵 果子 进程 应 常 终止 就 返 问 真 ， 也 就 是 通过 调用 exit 或 者 一 个 返回 
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return ). 

• WEXITSTATUS(stauus): 3&f— IF EX IER ГЕ iB ШАА. AAA WIFEXITED E f] 
ља, Л УИК. 

° WIFSIGNALED(status): ДЕД А ААВ КН ӨЗЕНІ РЈ, BAREN 
Н CKA SS ПНА ©). 

• WTERMSIG(status): EP35 | f HEREER LR) S Е. HAE WIFSIGNALED(status) 返 
НЕН, ТЕХ, 

。 WIFSTOPPED(status): ШЕЗЖІКІНІШ ЕЗБЕ НЕНІ, ЖАЗАНЫ. 

。 WSTOPSIG(status): 返回 引起 了 进程 暂停 的 信号 的 数量 。 具 有 在 WIFSTOPPED (status) Ж 
HAH A XXX TAS. 


错误 条 件 
ЖИЕГІНЕН, WA waitpid 返回 -1， 计 二 设置 errno 为 ECHILD 。 Ж.Ж waitpid A 


数 被 个 信号 中 断 ， 那 么 它 返 回 -1， 并 设置 ermo 为 EINTR. 
ӛз; * Unix 函数 相关 的 常量 


像 WNOHANG 和 WUNTRACED 这 样 的 常 重 是 由 系统 基文 忻 定义 鸭 ， 俩 如 ，WNOHANG 和 


WUNTRACED 是 由 wath AAH (间接) 定义 的 : 


/* Bits in the third argument to 'waitpid'. */ 
ЕдеГіпе WNOHANG 1 /* Don't block waiting. %/ 
Kdefine WUNTRACED 2 /* Report status of stopped children. */ 


x T4b EK. ioc dee AE 6,6- waith X x4: 


$include «sys/wait.h» 


每 个 Unix 函 教 的 man ЙИ T Xe РГЕ F 5 DOUBT ERES EERTEXXT. BB. 


为 了 检查 诸如 ECHILD 和 EINTR Z X 8 E N, 45249,4- еппоһ, AT 45d Ds AU, 
我 们 包 例 了 一 个 称 为 csapph FX X fF. EE dE T RAopARURISPEDR ACA X XE. MR ВРУ 
1 csapph X X4f, 


示例 
图 8.15 展示 了 个 创建 N 个 了 进程 的 程序 ， 使 用 waitpid 等待 它们 终止 ， 然 后 售 在 每 个 终止 了 了 


进 科 的 退出 状态 。 


SRPA Unix #2 Бла т, CE p: 
unix ./waitpidl 
child 22966 terminated normally with exit status 100 


child 22967 terminated normally with exit status = 101 


codefecf/waitpid l.c 
кіпсішде "csapp.h" 
fdefine N 2 


int maini) 


| 


— £x in m Lo {> н 


сп 
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int status, i; 
pid t pid; 


far tí = 0; i < N; i++] 
if (ipid = Fork()) == 0) /* child */ 
exitil10041)5; 


/* parent waits for all of its children to terminate */ 
while '(pid = waitpidí-1l, &status, O03) > Q) 
if (WIFEXITEDistatus)) 


321 


printrt("child %à terminated normally witi exit statJjs-s*dXn", 


pid, WEXITSTATUS(status!)]: 
else 


printf("child &d terminated abnormallyin", 


} 
if (екгпо 1- ECHILD) 
unix erroríi"waitpid error"); 


exiti(id): 


£8.15 使 用 waitpid Pixel ТИЕ 


*tinclude "csapp.h" 
$define N 2 


int mainí) 


| 


int status, i: 
pid L pid(N«1!, retpid: 


tor {i = D; 1 < N: із) 
if i(pid[i] = Fork()) == 0) /* child */ 
екік(100-1); 


/* parent reaps N children in order %/ 

i = 0; 

whi.e ((re-pid = waltpidipidlis«], &status, 
if iWIFEXITEDisStatus!) 


pid); 


cade/ecf/waitpidl .c 


code/ecf/waitpid2.c 


{ 


printfí("child €&d terminated normally with exit status-&dXn', 


retpid, WEXITSTATUS(status)); 
else 


printfí"child $d terminated арлогта11у\п", retpid); 
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23 /% The only normal termination is if there are no more children */ 
24 if (errno !- ECHILD! 
25 unix errorí("waltpid error"; 
26 
27 ex1L (Ü); 
28 | 
-——  5---- code/ecf/waitpid. c 


图 816 (EF) woitpid 按照 便 死 子 进程 创建 的 顺序 回收 它们 
注意 ， 程 序 不 会 按照 某 种 特殊 的 顺序 回执 子 进 程 。 图 8.16 展 下 了 我 们 可 以 如 何 用 waitpid 08 


多 进程 创建 子 进程 的 相同 顺序 来 回收 图 8.15 中 的 了 进程 。 





练习 题 8.4 
考虑 下 面 的 程序 ， 
1 finclude "csapp.h" 
2 
i int mainit 
4 1 
5 int status; 
6 pid t pid; 
- 
8 printfit"Helloin"); 
9 pid = Forki); 
10 printfí("£din", ігій); 
11 if ipid != O) Í 
12 if (waltpidí(-1, status, 0) > 0) 
13 if (WIFEXITEDistatus) !- 0} 
14 printfí("$dXn", WEXITSTATUS (status) ); 
15 ) 
16 } 
7 prliÇntf("Byexn"]; 
18 exit(2); 





A. Ж ҖЕ ДЕУ" k $ Ye FE ЯТ? 
B. 远 些 输出 行 的 一 种 可 能 的 顺序 是 什么 ? 


844 让 进程 休 眼 
sleep 08-Е FEES - - 段 时间 。 


Kinclude «unistd,.h- 


unsigned int sleep(unsigned int secs); 


c eodef/ecj/waitprabl.c 


code/ecf/waitprobl.c 





ар); РУ, 
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sleep Ағ) 0 如 果 请 求 的 时 间 量 已 经 到 了 )， 或 者 返回 剩 下 的 要 休 眼 的 秒 数 。 后 ~ 种 情况 基 可 
EERI Pii sleep 函数 被 一 个 信号 中 渐 过 时 返回 时 。 我 们 将 在 8.5 节 中 详细 讨论 信号 。 

我 们 发 现 很 有 用 的 男 -TARE pause ЕШ, АЙЫЛ ЕЖ ЖІК, ПАНЕ А ЧБ 
号 为 止 。 


Kinclude c«unistd.h-» 


int pauseívoid!; 





% JM 8.5 
编写 一 个 sleep 9 6, ЖЖЖ, "Ч snooze， 带 有 下 面 的 接口 : 


unsigned int snoozelunsigned int secs); 


snooze АЖ sleep AAHH AREE, ТАТАР #18 BORGO UE ORE E RT $ x 
时 间 以 外 ，。 


Slept for 4 of 5 secs. 


8.85 加载 并 运行 程序 
execve 函数 在 当前 进程 的 上 下 文中 加载 并 运行 一 个 新 程序 。 


$5include «unistd.h-» 


int ехесуе (сһаг *rilename, char *argv[], char *envp):; 


若 戌 功 则 不 提 回 ， 若 错误 则 授 回 -1， 





execve ЖІ 2217 а АҢ ЖУ flename， 时 带 参 数列 表 атру 和 环境 变量 列表 envp. Я 
有 当 出 现 铺 误 时 ， 鲍 如 不 能 发 现 füename, execve 才 会 返回 到 调用 程序 。 所 以 ， 不 像 fork 会 一 次 调 
用 返回 两 帝 ，execve 亩 用 一 次 并 从 趟 返回 。 

如 图 8.17 所 水 ， 参 数列 表 荐 用 数据 结构 表示 的 。argv 变量 指向 一 个 以 null E PES ЖЩ. E 
中 每 个 指针 都 指 癌 一 个 参数 串 。 按 照 习 俗 ，argy[0] 是 可 执行 日 标 文件 的 名 字 。 环 境 变 量 指 列 表 是 由 
一 个 类 似 的 数据 结构 表示 的 ， 如 图 8.18 Ar. епур 变量 指向 一 个 以 nul 结尾 的 指针 数组 ， 其 中 每 
个 指针 指向 一 个 环境 变 景 品 ， 其 中 每 个 申 都 是 形 如 “NAME=VALUE” 的 名 字 一 值 对 。 


argv [1 


argv [arge — 1] 


NULL ^ /uger/include" 





图 5.1” 参数 列表 的 组 织 结构 


在 execve 加 载 了 filename 之 后 ， 它 调用 7.9 节 中 描述 的 启动 代码 。 启 动 代码 准备 好 栈 ， 并 将 控 
制 传 递 给 新 程序 的 主 函 数 ， 该 主义 数 有 如 下 形式 的 原型 : 


524 ИЧЕ з 


int maintint агас, char **argv, char **envni!; 
成 者 等 价 的 ; 


int main[int arge, char *argv[], char *envpll?: 





anvpí] 
. 一 一 一 
| вттур — envp!ü] "PWD= /uer/droh" 


envp 1] 一 一 一 一 - 一 一 一 
- "BEARINTER- iron" 


envpin- 1] ~ 
NULL | "USER-droh" | 


8.18 ”环境 变量 列表 的 组 织 结构 


У main 开始 在 -个 Linux 系统 上 执行 时 ， 几 卢 族 有 如 图 8.19 所 水 的 组 织 。 计 我 们 从 栈 底 【 疡 
жі АҢ Cun. HORE 看。 首先 基 参 数 和 环境 字符 吊 ， 尼 们 都 是 连续 地 存放 在 栈 中 的 ， 
一 个 按 -个 ， 没 有 分 隔 。 紧 随 其 后 ， 在 乒 的 更 上 层 里 ， 是 以 null 结 屁 的 指针 数组 ， 其 中 每 个 指针 者 
指向 栈 中 的 “个 环境 变量 串 。 全 局 变量 environ 指向 这 些 指 针 中 的 第 一 个 епур(0]. KHARE EN 
组 其 后 的 是 以 null 结尾 的 argi ] 数 组 ， 基 中 每 个 元 素 部 指向 栈 中 一 个 参数 串 。 在 栈 的 顶部 是 main 
"ER З 个 参数 ， епур, Tii envp[ ЙІ; argv, “IR 0] arev[ ] 数 组 ，argc， 它 给 出 agv PiE 
指针 的 数 最 。 








ОхОРЕРЕЁРЕ Г —— БЕК 
LÀ null £& EB] ER 18 e tg E 


El null ЖИТ РЇ, 参 数 中 


етулр [т = 


envp[n-— 1] 





| environ | 


| argv[argc] = NULL 


агауГагас- 1] 


argv [0] 





9.19. 当 一 个 新 的 程序 开始 时 ， 用 户 栈 的 典型 组 织 
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Unix 提供 了 几 个 函数 来 操作 环境 数组 ， 


$include «stdlib.h» 


char *getenv(const char *nàme); 


返回 ; 车 存在 则 为 指向 名 字 的 指针 ， 落 无 匹配 的 ， 则 为 NULL. 


getenv 函数 在 环境 数组 中 搜索 字符 串 “name=value”， 如 果 找 到 了 ， 它 就 返回 一 个 指向 value 的 
指针 ， 和 否则 它 就 返回 空 指针 。 


#include <stdlib.h>» 





int setenv (const char *name, const char *newvalue, int overwrite); 


返回 ， 若 成 功 则 为 D， 藻 错误 则 为 -ji 


void unsetenvíconast char *name): 





E: X. 


如 果 环 境 数 级 包 省 一 个 形 如 “name=otkdvaluge ”的 字符 串 ， 那 各 unseteny WERE. M seten 会 
用 newvalue 代替 oldvalue, PERAE overwirte 非 零 时 才 会 这 样 。 如 果 name МЕТЕ. ЖА setenv 
就 把 *name=newyvalue” 添 加 到 数组 中 ， 


53. Æ Solaris E mTEESGER 
Solaris 提供 putenv 函数 ， 而 不 是 setenv ilk, E MO ME BUR S T useten КУ AK 


$t. ЖЕН 

TE-A 00607, ЖТА, RATTBUEESMT TUO ЕКИН X 3). ЖА ЖАД 
数据 的 业 合 ; AEA TY ИН ЛЕНЕТ ЕЖЕ. ӘЖЕЗЕЯЕТАНтІЕФ%. SIE Sr 
程序 的 一 个 特 珠 实例 ЯЛЕЛЕНЕЖЛЕЯНІТАФ, ЭЖЕ АЛЕМИ fork 和 execve 函数 ， 
理解 这 个 差异 是 很 重要 的 ，fork 函数 在 新 的 于 进程 中 送行 相同 的 程序 ， 新 的 于 进程 是 父 进程 的 一 个 
X. execve 函 堵 在 类 葡 进 竹 的 上 王 丈 中 加 载 并 和 运行 一 个 新 的 程序 ， 它 食 重 盖 当 前 进程 的 地 址 空 
间 ， 但 并 没有 全 建 一 个 新 道 程 、 新 的 程序 仍 标 有 相同 的 PD， 并 且 继 承 了 调用 execve ARNIR t 
所 有 文件 描述 符 ， | 


= 3M 8.6 
编写 一 个 叫做 myecho 的 程序 ， 它 打印 出 它 的 命令 参数 和 环境 变量 。 例 如 ; 


іпіх> ./myecho argl arg? 
Command line arguments: 
argv[ 01: myecho 
argv[ 1]: argl 
argv[ 2]: arg2 
Environment variables: 
envp[ j]: PWD-/usrÜ/drcoh/ics/code/ec* 
envp[ 1]: TERM-emacs 
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envp[25]: USER-droh 
envp[26]: SHELL-/usr/loczal/bin/tcsh 
епур(271: HOME-/usrÜ/dr5h 


8.4.6 利用 fork 和 execve 运行 程序 

像 Unix shell 和 Web 服务 器 《第 12 章 ) 这 样 的 程序 大 量 使 用 ”fork 和 execve В. shell 是 - 
个 诡 互 型 猩 应 用 角 程 序 ， 它 代表 用 户 运行 其 他 程序 。 最 早 的 shell 是 sh Е, БЕШ фа, 
比如 csh. tesh, ksh 和 bash. shell 执行 一 系列 的 读 / 来 值 Cread/evaluate) 步骤 ， 然 后 终止 。 读 步骤 
读 取 来 日 用 户 的 一 个 命令 行 。 求 值 步 又 解析 命令 行 ， 并 代表 用 户 运 行程 序 。 

图 8.20 展示 了 个 简单 shell 的 main ЖЕ. shell 打印 一 个 命令 行 提示 符 ， 等 竺 用户 在 stdin 上 
输入 命令 行 ， 然 后 求 值 (evaluate) 这 个 命令 行 。 





code/ecffshellex.c 
1 include "csapp.h" 
2 define MAXARGS 128 
3 
4 /* function prototypes */ 
5 vold ема1 (слаг *cmdáline); 
Ё int parseline(const char *cmdline, char **атду); 
7 int builtin, command(char **argv!; 
8 
Q int maini) 
10 ( 
11 char cmdline [|MAXLINE]; /* command line */ 
12 
13 while (1) { 
14 /* read */ 
15 printfí("» "); 
16 Fgets(cmdline, MAXLINE, stdin); 
17 if (fteofí(stdini) 
18 exití(0); 
19 
20 /* evaluate */ 
21 evali(cmdline)!; 
22 ) 
23 } 
code/ecf/shellex.e 





818.20 一 个 简单 shell 程序 的 man pg 
% 821 展示 了 求 值 (evaluate ) 命令 行 的 代码 。 它 的 第 一 个 任务 是 调用 parseline 1 (图 8.22), 
这 个 能 数 解 术 了 以 空格 分 隔 的 命令 行 参数 ， 并 构造 最 终 会 传递 给 execve 的 ару 向 量 。 第 --. 个 参数 
被 假设 为 蓝 么 是 - :个 大 置 的 shell 命令 名 字 , 马上 就 会 解释 这 个 命令 , 昌 么 是 一 个 吕 执 行 的 昌 标 文件 ， 
会 在 一 个 新 的 了 进程 的 上 下 文中 加 载 并 运行 这 个 交 件 ， 








rode/ecffshellex.c 
1 /* eval - evaluate a command line */ 


2 void evalíchar *cmdliae! 
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Ë { 

4 char *argv [MAXARGS];  /*argv for execve() */ 

E int bg; 1% should the job run in bg or fg? */ 

É pid t pid; /* process id */ 

7 

B bg = parselineí(cmdline, argv}; 

9 if fargv[O0] == NULL) 

10 return; /* ignore empty lines */ 

11 

12 іг [!bulltin ccemmand(argv)?) { 

13 i: {ipid = Fork()) == 0) f /*child runs user job */ 

14 it (ехесуе {агоу [0], агач, environ) < O) 1 

15 printf("$5: Command not found. n", агду[0]}; 

16 ex1t (0); 

17 ) 

18 ) 

19 

20 /* parent waits for foreground job to terminate */ 

21 if (!ba) { 

22 int Status; 

23 itf (waitpidipid, &status, 0) < 0) 

24 unix error("waltifg: waitpid error"); 

25 ) 

26 else 

27 printfí("&d $s", pid, cmdlinel; 

28 } 

29 return; 

30 } 

al 

32  Jjffirstarg is a builtin command, run it and return true */ 

33 int builtin commandí(char **argv) 

34 { 

35 if (!strempíargv[0], "quit")! /* quit command */ 

36 ехії {0}; 

37 if (Istrempíargv[O0], "&")) ж ignore singleton & */ 

38 return 1; 

39 return 0; /* not a builtin command */ 

40 ) 
code/ecfishellex.c 

8.2] eval: ЖЇН (evaluate) shell 命令 行 

cade/ecfishellex.c 

l — f*parseline - parse the command line and build the argv array */ 

2 int parseline/|const char *cemdline, char **argv) 

3 { 

4 char array[MAXLINE]; /*holdslocal сору of command line */ 

5 char *buf - array; {* ptr that traverses command line */ 

6 char *delim; Ре points to first space delimiter */ 

7 int arge; /* number of args */ 
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8 int pg: /* background job? */ 

9 

10 strcpyibutf, cmdline): 

11 bufistrlen(buf)-1] = ' '; терасе trailing ^n’ with space */ 
12 while |*buf k& (“ЧЕ == ' ')) f*ignore leading spaces */ 
13 buf; 

14 

15 /* build the argv list */ 

16 ағас = 0; 

17 while ((delim = strchríbuf, “ '))) Í 

18 argv[argco«] = buf; 

19 *delim = "506: 

20 buf = delim + 1; 

21 while (*buf && (*buf == ' ']} /*ignorc spaccs */ 
22 buf-«-; 

23 } 

24 argvíargc] = NULL; 

25 

26 IË (ағас == C) /*ignore blank line */ 

2 return 1; 

28 

29 {* should the job run іп the background? */ 

30 if (ibg = (*argv[argc-1] == *'&')) != Q) 

il argv[--argc] = NULL; 

32 

33 return bg; 

34 } 


codefecf/shellex.c 
ІҢ 8.22 parseline: 为 shell — P 5& AS 

ШЖ ^ &E"CETE. ЖА parseline 返回 1， 表示 应 该 在 后 台 执 行 该 程序 (shell 
不 会 等 竺 它 完成 )。 否 则 ， 它 返回 0， 表 示 永 该 在 前 台 执行 这 个 程序 (shell 会 等 待 它 完成 )， 

在 解 和 了 命令 行 之 后 ，eval HAHH builtin command ЖШ, iie 8 а 
是 TARM shell 命令 。 如 果 是 ， 它 就 立即 解释 这 个 命令 ， 并 返回 值 1 和 否则， 返回 0， 我 们 简单 
的 sheli 只 有 -个 内 置 命 令 一 一 quit 命令， 该 命令 是 用 来 终 直 shell 的 。 实 际 使 用 的 shell 有 大 量 的 命 
4, ДЕШІ pwd, jobs 和 fg. 

如 果 builtin command 3&[F| 0， 那么 shell 创建 一 个 子 进程 ， 并 在 子 进程 中 执行 所 请 求 的 程序 。 
WAR EREDT AAT. WA shell 返回 到 循环 的 顶部 ， 等 待 下 一 个 命令 行 。 洗 则 ，shell 
(ЕНІ waitpid EE AERE. ЕУ НЫ, shell 就 开始 下 一 轮 和 迭代 。 

注意 ,这 个 简单 的 shell Ж ВАШ. BJAPCOET Bl a e EXFL Meu x A ER ok e 
用 信和 号， 我 们 将 在 ЗА Б. 


85 ”信和 号 


色目 部 为 止 ， 在 我 们 对 异常 控制 流 的 学 习 中 ， 我 们 己 经 看 到 了 夸 件 和 软件 尾 如 何 合作 以 提供 基 


ЖКА ҮЙ 


机 制 的 。 


异常 控制 流 
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КЕНТ ЕАЖЕШЫЛ НИЕ REE REMAR ЕЕ ЙИ. 


也 就 是 所 谓 的 上 下 文 切 换 。 在 本 节 中 ,我们 将 研究 一 个 更 高 层 软 件 形式 的 异常 ， 称 为 Unix 信号 ， 它 
允许 进程 中 断 其 他 进程 。 


— f 1&5 (signal. i — 


条 消息 ， 它 通知 进程 ОНЕ EST, ИШ. 
图 323 展示 了 Linux 系统 上 支持 的 30 种 不 同类 型 的 信号 。 


— т | _ RA 相应 事件 


ы іс èë uA ë h LA ш шш м - 


SIGHUP 

SIGINT au 

SIGQUIT A (l: 

SIGILE E m 

SIGTRAP SpA MS (1) 
SIGABRT 终 让 并 转 情 存储 器 【1) 
SIGBUS яа 

SIGPFE ааа” RES (1) 
SIGKILL gr: (2) 

SIGUSRI 终止 

SIGSEGV # IL gERERE ERR (1) 
SIGUSR2 终止 

SIGPIPE ЖІК 

SIGALRM 
SIGTERM 
SIGSTKFLT 
SIGCHLD 
SIGCONT 
SIGSTOP 
SIGTSTP 
SIGTTIN 
SIGTTOU 
SIGURG 
SIGXCPU 
SIGXTSZ 
SIGVTALRM 
SIGPROF 
SIGWINCH 
SIGIO 
SIGPWR 
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& iE B SI FA SIGCONT (2) 
入 小 直到 下 P SIGCONT 
ЖЕНТ -个 SIGCONT 
停止 育 到 下 一 个 SIGCONT 


线 端 线 挂 起 

Ж Retard e 

来 上 月 键盘 的 退出 

非法 指令 

IR ERE 

ЖН abort ESTER ES S 
ЕЖЕН 

H GOLPE 

ЖЕНЕ 

用 户 定义 的 信号 1 

En dob I rr ES E» 
用 户 定义 的 信号 2 

向 一 个 没有 读 用 户 的 管道 做 写 操 必 
Ж Н alarm ЛМЕ S 
软件 终止 信号 

协 处 理 器 上 的 技 故障 

一 个 子 进程 暂 做 或 者 终止 
继续 进程 如 果 该 进程 停止 
Е ЧЕ A 

* EB mE 5 
наны 
АЖЫ IS H H 

EET EK 

CPU 时 间 限 制 超出 

ХИМ HEH 
ШЕМЕНІ 
inr E p ЖІК 

WU KAS 
ЕЖЕ Lv ӨЗЕН 
电源 故障 


其 他 Unix 系统 旦 类 似 的 ,注意 ; CD 多 年 前 ， 主 存 情 器 是 用 - 种 称 为 磁 芯 存 情 器 (core memory? 的 技术 来 实现 的 .“ 转 合 存 
бак (dumping core)” 是- ' 个 历史 术语 ， 意 思 足 把 代码 和 数据 存储 器 段 的 欧 传 写 到 有 磁 邢 工 。(2) 这 个 信 和 号 多 不 能 被 捕获 ， 也 


ЖЕЕ. 
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每 种 信号 类 型 痢 半 应 于 某 个 辩 型 的 系统 事件 。 低 层 的 硬性 异常 是 由 内 核 异 常 处 理 程 序 椒 理 的 ， 对 
膨 户 进程 而 言 通常 是 木 可 网 的 。 术 号 提 贷 了 一 种 机 制 同 用户 进 程 通知 这 些 异常 的 发 生 。 比 如 ， 如 果 - 
个 进程 试图 除 以 9， 那么 内 校 就 发 送 给 它 一 个 SIGFPE 信号 (号 码 8)。 如 果 一 个 进程 执行 一 条 非法 指 
令 ， 那 么 内 核 就 发 送 给 它 一 个 SIGILL 信号 (号 码 4)。 如 果 进 程 有 非法 存储 器 引用 ， 内 核 就 发 送 给 它 
-个 SIGSEGV 信号 《号 码 11}。 其 他 信 和 号 对 应 于 内 核 成 者 其 他 用 户 进 程 中 较 高 居 的 软件 事 忻 。 比 旭 ， 
如 果 当 进程 在 后 台 运 行 时 ， 你 键入 ctrl-c 《也 就 是 同时 按 下 ctd SERI c 580. BARRAS AST 
SIGINT 信号 (号 码 2) 给 前 全 进程。 一 个 进程 可 以 通过 发 送 一 个 SIGKILL 信号 (号码 9) 强制 终止 
男儿 一 个 进程 。 当 一 个 子 进 程 终 目 或 者 暂停 对， 内核 会 发 送 一 个 SIGCHLD 信号 《号码 17) 给 父 进程 。 


8.5.1 信号 术语 

传送 一 个 信号 到 日 的 进程 是 由 两 个 不 同步 骤 组 成 的 : 

«AEG. 凤 核 通过 更 新 吕 的 进程 上 下 文中 的 某 个 状态 ， AE GE 一 个 信号 给 日 的 进程 。 
发 送信 与 可 以 有 如 下 天 种 原因 : 全 内 核 检测 到 一 个 系统 事件 ， 比 如 除 地 错误 或者 子 进 程 络 
Ik; 2-- БИЖИҢ Т kill 83k СЕК - 节 中 讨论 ;， 显 式 地 要 求 内 核发 送 一 个 信号 给 日 的 
ЖЕ. -个 进程 可 以 县 送 信号 给 安 日 已 。 

о Hd, 当 目 的 进程 被 内 悦 强 连 以 某 种 方式 村 信号 的 发 送 居 出 反应 时 , 日 的 进程 就 接收 了 
信号 。 进程 可 以 把 略 这 个 信号 , 终止 ， 或 者 通过 执行 一 个 称 为 信号 处 理 程序 (signal handler? 
IB БЕ ER XT B =. 

—^ B ARI SCRAP TR БИКА ЗЕ SU (pending signal). 在 任何 时 刻 ， PEHEE 
пен ША, ШЖ -个 进程 有 一 个 类 型 为 丰 的 待 处 理 信号 ， 那 么 任何 接 下 来 发 送 到 这 个 
进 和 在 的 医 型 为 的 信号 都 不 会 排队 等 待 ， 它 们 只 是 被 简单 地 丢弃 。 一 个 进程 可 以 有 选择 性 地 陋 塞 接 
收 茶 种 信号 。 当 一 种 信号 被 阻塞 时 ， 它 仍 可 氛 被 发 送 ， 介 是 产生 的 待 处 理 信 号 不 会 被 接收 ， 和 直到 进 
程 取消 对 这 种 信号 的 阻塞 。 

个 待 处 理 信 号 最 多 只 能 被 接收 -次 。 内 核 为 每 个 进程 在 pending 位 向 量 中 维护 者 待 处 理 信 号 
Жа, MHE blocked 位 和 启 量 中 维护 着 被 骨 塞 的 信号 集合 。 只 要 一 个 类 型 为 k 的 信号 被 传送 ， 内 核 就 
"fk pending fe [| S P3 EB. КМУ. 038 УЭЛ р k 的 信号 被 接收 ， 内 核 就 会 全 pengding 位 
问 量 中 清除 第 上 个 位 。 


852 发 送信 号 

Unix 系统 提供 了 大 量 的 机 制 ， 用 来 发 送信 和 号 座 进 程 。 所 有 这 些 机 制 都 是 基于 进程 组 process 
group) 这 个 概念 的 。 

进程 组 

每 个 进程 部 只 恬 于 -个 进程 级， 进程 组 是 由 一 个 下 整数 进程 组 ID 来 标识 的 。getpgm PACA |E 
МЕНЕН 48 ID: 


finclude «unistd.h- 


pid t getpgrpivoid); 





返回 : 调用 进程 的 进程 组 ID. 
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默认 地 ， 一 个 子 进程 和 它 钓 父 进程 同属 于 - -个 进程 组 。 一 个 进程 可 以 通过 使 用 setpgid 水 数 来 改 
变 自己 或 者 其 他 进程 的 进程 组 : 


#include <unistd.h> 


pid t setpgid pid t pid, pid t pgid); 





RE: Ab 8] X 0. # 8450121. 


setpgid ОНОН pid 的 进程 组 改 为 pgid。 WE pid 是 0, ЖЛ ИЛИШ SERN PID. ШЖ pgid 
E0 BARH pid 指定 的 进程 的 PID 作为 进程 组 中， 例如 ， 如 果 进 程 15213 是 调用 进程 ， 那 么 

setpgid(0, ü}; 

会 创建 一 个 新 的 进程 组 ， 其 进程 组 ID E 15213， 并 且 把 进程 15213 吉 入 到 这 个 新 的 进程 组 中 。 

用 xin 程序 发 送信 和 号 

fouvkill 程序 可 以 网 男 外 的 进程 发 送 任意 的 信号 。 比 如， 命令 

unix- kill .9 15213 
发 迁居 号 9 (SIGKILL) 给 进程 15213。 一 个 为 负 的 PD 会 导致 信号 被 发 送 到 PID 进程 组 中 的 每 个 
进程 。 比 如 ， 命 令 

unix» kill .9 ‚152113 
发 送 一 个 SIGKILL 信号 给 进程 组 15213 中 的 每 个 进程 。 

D S SS 

Unix shell 使 用 作业 job) 的 抽象 概念 来 表示 求 值 (evaluating). 一 条 命令 行 而 产生 的 进程 。 在 
任何 时 刻 ， 至 名 只 有 一 个 前 台 作 业 和 人 0 个 或 多 个 后 台 人 作业。 上 比如， 键入 

unix» Is | sort 
创建 -- 个 由 两 个 进程 组 成 的 前 台 作 业 ， 这 两 个 进程 是 通过 Unix 管道 连接 起 来 的 ;一 个 进程 运行 18 
FRE, E 一 个 运行 son Ж, 

shell 为 每 个 作业 创建 一 个 独立 的 进程 组 。 和 典型 地 ， 进 程 组 ID 是 取 自 作业 中 父 进程 中 的 一 个 。 
tem, 8 8.24 展示 了 -个 有 一 个 前 台 作 业 和 两 个 后 台 作 业 的 shell, 前台 作业 中 的 父 进程 PID 为 20, 
进程 组 ID 也 为 加。 父 进程 创建 两 个 子 进程 ， 每 个 也 都 是 进程 组 20 的 成 员 。 

在 键盘 上 输入 ctrl-c， 发 送 SIGINT 信号 到 shell. shell 捕获 该 信号 (参见 8.5.3 节 )， 然 后 发 送 
SIGINT 信号 到 这 个 前 台 进 程 组 中 的 每 个 进程 。 在 默认 情况 中 ， 结 果 基 终止 前 台 作 业 。 类 似 地 ， 输 
入 ctrl-z 会 发 送 一 个 SIGTSTP 信号 到 shell. shell 捕获 这 个 信和 号， 并 发 送 SIGTSTP 信号 给 前 台 进 程 
组 中 的 每 个 进程 。 在 默认 情况 下 ， 结 时 是 暂停 〈 挂 起 ) яға. 

用 kill ARRES 

进程 通过 调用 kill 消 数 发 送信 号 给 其 他 进程 (包括 它们 自己 ); 


#include <sys/types.h> 
#include «signal.h- 


int killipid t pid, int sig); 





Ж: ERARA O0 # M53912 -1. 
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ВЕБЕ a e CK. ty 










i pid=32 : 


-20{ , | F aata Гече) pid=40 
! : IN i pgid-32 | ұ) }{рОїй=40 
)— : : — | IN 
` NARRAN 万 台 进程 组 4 


рій-21 рій-22 


ВЕЕР 20 


图 8.24 前 台 和 后 台 进 程 组 
AUR pid XT, ЖА kil IR БШК ЕИ sig 给 进程 pid。 WE pid HFE, WA кш 发 送信 
号 sig 给 进程 组 abs(pid)F f) SEAT ERE. А 8.25 展示 了 一 个 示例 , 父 进 程 利用 kul m 086 SIGKILL 
fü sacrum. 
——— — —— V T  H<|noəlqÁfeÑaə pllwii 





1 #include "csapp.h" 
д 
3 irt main] 
4 { 
5 pid t pid; 
б 
7 /* child sleeps until SIGKILL signal received, then dies */ 
8 if (ipid = Fork()) == 0) í 
3 7ause{}; /* watt for а signal to arrive */ 
10 printfí*control should never reach here!in"); 
11 ехі (01; 
12 } 
13 
14 /+ parent sends а SIGKILL. signal to a child */ 
15 Killipid, SIGKILL]!; 
16 exit:0); 
l7 } 
code/ecj/kill.c 
Hi 3.25 使 用 kill dj fex s iA Ted 
Hl alarm SEA Efi = 


ЖИИ ЫЙЫ alarm кй ГЕ B OX SIGALRM Е. 
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Kinclude «unistó.h- 








unsigned int alarmíunsigned int secs); 
返回 : Қ-А eg dE, Arla K НР, mmo 0. 
alarm 64 ТОННА Ж ТЕ secs 秒 内 发 送 一 个 SIGALRM 信号 给 调用 进程 。 如 果 secs EF, WAR 
会 调度 新 的 闹钟 Calam). 在 任何 情况 中 ， 对 alarm 的 调用 都 将 取消 任何 符 处 理 的 《pending) iff, 
并 用 返回 任何 待 处 理 的 六 钾 应 该 发 送 前 剩 下 的 种 数 【 如 果 这 次 对 alarm ЗЛ АНОН ERTE), 或 
者 如 果 没 有 任何 待 处 理 的 闹钟 ， 就 返回 零 。 
图 8.26 展示 了 -个 调用 alarm 的 程序 ， 它 安排 日 已 被 SIGALRM 信和 号 在 5 种 内 每 秘 中 断 一 次 。 
当 传送 第 6 个 SIGALRM 信号 时 ， 它 就 终止。 


codefecf/alarm.c 


1 4include "csapp.h" 

2 

3 void handle-í(int sig!) 

4 { 

5 static int beeps = Ü; 

5 

7 printfí("BEEPVWn"]; 

8 if («-beeps < 5) 

9 Alarm(1); М next SIGALRM will be delivered in 1s */ 
10 else ( 

11 printf("BOOMIXn"); 

12 exitio); 

13 ) 

14 ) 

15 

16 int таіп() 

lj [ 

15 SignaliSIGALRM, handler!; /* install SIGALRM handler */ 
18 Alarm(1); /* next SIGALRM will be delivered in 15 */ 
20 

21 while 11) í 

22 ; f* signal handler returns control here each time */ 
23 ) 

24 exit (D); 

25 ) 


rode/ecf/alarm.ec 
Hi 3.26 使 用 alarm d firj ic fe БИТЕ 


ПЕТ 8.26 中 的 程序 时 ， 我 们 得 到 以 下 的 输出 ，5 PPPISERP— P “ВЕЕР”. БШ Ж 
程序 终止 时 的 一 个 “BODM ": 


unix» ./alarm 


534 第 8 章 


BEEP 
ВЕЕР 
ВЕЕР 
ВЕЕР 
ВЕЕР 
BOOM! 


注意 图 8.26 中 网 程序 使 用 signal MARAS- AET AR OK Cander, REWERA 个 
SIGALRM 信和 号， 就 异步 地 调用 该 函数 ， 中断 main 程序 中 的 无 限 while 循环 。 当 handler 返回 时 ， 控 
БИМЕН main 6%, 它 就 从 当初 被 信号 到 达 时 中 断 了 的 地 方 继续 执行 , ВАНИЕ НИЕ КЕ РЕ РЕВ 

E 是 相当 微妙 的 ， 这 将 是 下 面 三 节 讨 论 的 主题 。 


8.5.3 ”接收 信号 

HARA КАКА, EAA RH ERE р, к= ЕЛЕШЕ ТАНД 
ӘНЕ (pending& blocked). ШОХ ORAN) MARRAS р ШИЕ 
制 流 中 的 下 一 条 指令 (To). 

然而 ， 如 果 集 合 是 非 空 的 ， 那 么 内 核 选 择 集合 中 的 某 全 信号 大 (通常 是 最 小 的 上 )， 并 日 强制 p 
AUI E k. 收 到 这 个 入 号 会 触发 进程 的 某 补 行为 。 一 电 进程 完成 了 这 个 行为 , 那么 控制 就 传递 加 р 
的 选辑 控制 流 中 的 卜 -条 指令 (how}。 每 个 信和 与 类 型 部 有 “个 预定 义 的 默认 行为 ; 

* 进程 终止 。 

. їйї НЕТА 8 (dump core). 

. ”进程 暂停 直到 被 SIGCONT 信号 重启 。 

e XAR. 

图 8.23 展示 了 与 每 个 信号 类 型 相关 腾 的 默认 行为 。 比 如 ， 收 到 SIGKILL 的 默认 行为 就 是 终止 
接收 进程 。 另 外 ， 接 收 SIGCHLD 的 默认 行为 就 是 忽 赂 这 个 信号 。 进 程 可 以 通过 使 用 signat 男 数 修 
改 和 信号 衬 交 联 的 黑 斌 行为。 惟一 的 例外 是 SIGSTOP 和 SIGKILL， 它 们 的 默认 行为 是 不 能 修改 的 。 

&include zsignal.h» 
typedef void handle-z tí(int) 


handler t *signal(int signum, handler t *handler) 


iR). 着 成 功 则 为 指向 前 类 处 理 程序 的 措 填 ， 鞍 出错 则 为 SIG-ERR 不 设置 ermo. 





signa 函数 可 以 通过 下 列 二 种 方法 之 一 及 改变 和 情 号 signum 相关 联 的 行为 ， 

• AR handler 是 SIG_IGN， 那 么 忽略 类 型 为 signum 的 信和 号。 

• Ж: handler 是 SIG_DFL， 那 么 类 型 为 signum 的 信号 行为 恢复 为 默认 行为 。 

* ЖШ, handler 就 是 用 户 定义 的 函数 的 地 址 ， 称 为 信号 处 理 程 序 (signal handler). АЖЫ 
接收 到 一 个 类 型 为 signum 的 信号 , 就 会 调用 这 个 程序 , 通过 把 处 型 程序 的 地 址 传递 到 signal 
国 数 从 而 改变 歌 认 行为 ， 这 叫 慌 设置 习 号 处 理 程序 。 信 号 处 理 程序 的 调用 被 称 为 捕捉 信号 。 
信号 处 理 程序 的 执行 被 称 为 处 理 信忠。 

-r 个 进程 捕 提 了 一 个 类 型 为 直 的 信号 时 ， 为 信号 天 设置 的 处 理 程 序 被 调用 ， 同 对 惟 --- Ж 

数 参数 被 设置 为 上 ， 这 个 参数 允许 同一 个 处 理 冰 数 捕 掩 林 同类 型 的 信号 ， 
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当 处 理 程 序 执行 它 的 return 语句 时 ， 控 制 〈 通 常 》 传 递 回 控制 流 中 进程 被 信号 接收 中 断 位 置 处 
的 指令 。 我 们 说 “通常 ”是 因为 在 某 些 系统 中 ， 被 中 断 的 系统 调用 会 立即 返回 一 个 钳 误 。 

图 827 展示 了 一 个 捕获 用 户 在 键盘 上 输入 ctrl-c 时 shell 发 送 的 SIGINT 信号 的 程序 。SIGINT 
的 默认 行为 是 立即 终止 该 进程 。 在 这 个 示例 中 ， 我 们 将 默认 行为 修改 为 捕 扣 信号， 输出 一 条 信息 ， 
然后 终止 该 进程 。 


codefecf/sigintl.c 
1 kinclude "csapp.h' 
» 
3 void handler(int sig) /* SIGINT handler */ 
4 i 
5 printf "caught SIGINTMn"); 
6 exití(%0); 
р } 
8 
9 int ша1п[) 
10 1 
11 /* [nstall the SIGINT handler */ 
12 if (signal(SIGINT, handler) == SIG ERR) 
13 unix error[("signal error"); 
14 
15 рашве(); /+ wait for the receipt of a signal */ 
16 
17 exit (0); 
18 ) 
code/ecf/sigintl.c 


827 一 个 捕捉 SIGNI 信和 号 的 程序 
处 理 程 序 晒 数 定 文 在 第 3 一 7 行 中 。 主 函数 在 第 12 一 13 行 设置 处 理 程 诺 ， 然 后 进入 休眠 状态 ， 


直到 接收 到 -一 个 人 情 号 【第 15 行 }。 当 收 到 SIGINT 信号 时 , 运行 处 理 程 序 , 输出 一 条 信息 {第 5 行 )， 
然后 终止 这 个 进程 【第 6 行 )。 


练习 题 8 了 
5s 5 — ЛИ snooze 的 程序 ， 有 一 个 命令 行 参数 ， 用 这 个 参数 调用 习题 85 中 的 snooze ЕЖ, 
然后 终止 .编写 程序 ， 使 得 用 户 相 以 通过 在 键盘 上 输入 ctrl-c Ф Hg snooze dk, ket: 


unix» ./snooze 5 


Slept for 3 of 5 secs. User hits crtl-c after 3 seconds 
unix 


8.54 ”信号 处 理 问 题 

对 于 只 捕捉 -- 个 信号 并 终止 的 程序 来 说 ， 信 号 处 理 是 简单 直接 的 。 然 而 ， 当 一 个 程序 要 捕捉 多 
个 信号 时 ， 一 些 细微 的 问题 就 产生 了 ， 

€ 符 处 理 信号 被 阻塞 ,Unix 信号 处 理 程 序 典 型 地 会 阻塞 当前 处 理 程序 正在 处 理 的 类 型 的 待 处 
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Bee. ЕШ, Е-Е — T SIGINT 信和 号， 并 用 当前 正在 运行 它 的 SIGINT 处 
FEF. WRS -A SIGINT 信号 传递 到 这 人 小 进程 ， 那 么 这 个 SIGINT ЖАҒЫН. {Н 
是 不 会 被 接收 ， 直 到 处 理 程序 返回 。 

. 待 处 理 信 号 不 会 排队 等 待 . 任意 类 型 至 多 只 有 -ARER S. 因此 ， 如 果 有 两 个 类 型 为 上 
的 信号 传送 着 一个 口 的 进程 , 而 由 于 日 的 进程 当前 正在 执行 信号 的 处 理 程 序 ， 所 以 信号 
是 阻塞 的 ， 闭 么 第 二 个 信号 就 被 莘 单 地 丢弃 ， 它 不 会 排队 等 答 。 关 键 思想 是 存在 一 个 竺 处 
型 的 信号 仅仅 表明 至 少 已 经 到 过 了 一 个 信和 续 。 

4 系统 调用 可 以 被 中 颗 ， 像 read. write 和 accept 这 样 的 系统 调用 潜在 地 会 阻 罕 进 各 一 鼎 较 长 
的 时 间 ， 称 乙 为 慢 速 系统 调用 。 在 某 些 系统 中 ， 当 处 理 程序 捕 抑 到 一 个 信号 时 ， 被 中 断 的 
慢 速 系统 圈 川 在 信号 处 理 程序 授 加 时 不 下 继续 ， 而 是 立即 迭 回 给 用 户 一 个 错误 条 件 ， 并 将 
erno Б 8 29 EINTR. 

让 我 们 利用 一 个 简单 的 应 用 程序 更 深入 地 看 看 信和 号 处 理 的 细微 之 处 ， 这 个 应 用 程序 本 质 上 类 似 
T shell 和 Web БАНК ЖЕН. 基本 的 结构 是 一 个 父 进程 创建 一 皮子 进 各 ， 这 些 子 进程 独 
让 过 行 一 会 儿 ， 然 后 终止 。 父 进程 必须 回收 子 进程 ， 以 避免 在 系统 中 贸 下 恒 死 进程 ， 仁 是 我 们 也 极 
让 爹 进 程 在 子 进程 运行 时 机 以 日 由 地 他 其 他 工作 ， Ы, ЖЖ ЕШ SIGCHLD 处 理 程 序 回收 了 进 
程 ， 弄 不 是 亚 式 地 等 待 子 进 称 终 止 。( 回 想 一 下 ， 只 要 子 进 程 终 止 或 者 辆 停 时 ， 内 核 就 会 发 送 一 个 
SIGCHLD 信号 给 父 进程 。) 

31 8.28 展示 了 我 们 的 第 一 次 尝试 。 父 进 株 设置 了 个 SIGCHLD АЯН, АЕ Г 20 
进 称 ， 其 中 每 个 了 进程 运行 1 秒 ， 然 后 终止 ， 同 时 ， 父 进程 等 待 来 白 终 端的 个 输入 行 ， 随 后 处 型 
它 。 这 个 处 理 菩 模型 化 为 一 个 无 限 循 环 ， 当 每 个 子 进程 终止 时 ， 内 核 通 过 发 送 一 个 SIGCHLD 信号 
通知 父 进程 。 父 进程 捕捉 这 个 SIGCHLD 信和 号， 回收 一 个 子 进程 ， 短 一 些 其 他 的 清除 工作 模型 化 
为 sleep(2) 语 委 )， 然 后 返回 。 


code/ecf/signall.c 


1 "include "csapp.h" 

2 

3 void handlerli:nt sig! 

4 l 

5 21d L pid; 

6 

7 if 1 (pid = waitpid(-1, NULL, 01) < 0) 
В unix error("waitpld error"); 

9 printfí"'Handler reaped child $d\n", iint)pid); 
10 Sleep{ž}: 

11 return; 

1200) 

13 

14 int mainí) 

15 { 

16 int i, n; 


17 char buf [MAKEUF] ; 
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18 

19 1f (signal(SIGCHLD, handlerl} == SIG ERR) 
20 unix erroarí("signal error"); 

21 

22 /* parent creates children */ 

23 for (1 = Ü; i < 31-4) Í 

24 if IForx() == Ü) Í 

25 printfi"Hello from child *dádxn", (int)getpid()): 
26 Sleep[:.); 

27 ех1г{0); 

28 ) 

28 } 

30 

31 /* parent waits for terminal input and then processes it */ 
12 il (In = read(STD.N FILENO, buf, sizeofi(buf) < 0) 
33 unix error("read"); 

34 

35 printf ("Parent processing inputin"!; 
36 while 11) 

37 ; 

38 

39 exití0); 

4001 





code/ecf/signall.c 


B 8,28 signal! 
ЕҮРЕНЕНЕНІН, EXDEXGLNEGSSX. CET а ЕЕЕ ИШ: Mixed . 


ІҢ 828 中 的 signal] 程序 看 起 来 相当 简单 。 然 而 ， 当 我 们 在 Linux 系统 上 运行 它 时 ， 我 们 得 到 
如 下 输出 ， 


1inux» ./signall 

Hello from child 10320 
Hello from child 10321 
Hello from child 10322 
Handler reaped child 10320 
Handler reaped child 10322 
Tr 


Parent processing input 

处 答 出 中 ， 我 们 注意 到 ， 尽 管 发 送 了 3 个 SIGCHLD 信号 给 父 进程， 但 是 只 有 其 中 的 两 个 信号 
被 接收 了 ， 因 此 父 进程 只 是 回收 了 两 个 子 进程 。 如 果 我 们 挂 起 父 进程 ， 我 们 看 到 ， 实 际 上 ， 子 进程 
10321 没有 被 回收 ， 成 为 了 一 个 鼻 死 进程 : 


«<СЕГІ-т> 
Suspended 
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limix> ps 
PID TTY STAT TTME COMMAND 


10318 p5 T 1:03 signall 


10321 ру Z 0:00 isignzll «zombie») 
10323 p5 R 0:00 ps 


WES НИЕ ПЕ? МИЛЕТ AUD ИКЕ S BER fas nj САЗА ЕА ЗКУ IE RSS. F 
而 是 所 发 生 的 情况: 

父 进 程 接收 并 捅 担 了 第 一 个 信号 。 当 处 理 程序 还 存 处 理 第 一 个 信号 时 ， 第 二 个 信号 就 传送 并 添 
如 到 了 待 处 理 信 号 集合 里 . 然而， 因为 SIGCHLD 信号 被 SIGCHLD 处 理 程 序 阻塞 了 ， 所 以 第 二 个 
信号 就 不 会 被 接收 ， 此 后 不 久 ， 就 在 处 理 程 序 还 存 处 理 第 -个 信号 时 ， 第 一 个 信号 到 达 了 。 国 为 已 
经 有 了 一 个 符 处 理 的 SIGCHLD, #— + SIGCHLD 52854. јал Б, НБ, 
AREENA ARE SIGCHLD 信和 与 ， 就 迫使 父 进 程 接站 这 个 情 号 ， 信 进 程 捕获 信号 ， 基 第 
二 次 执行 处 理 程 奈 。 在 处 理 程序 完成 对 第 二 个 信号 的 处 理 之 后 ， 已 经 没有 待 处 理 的 SIGCHLD fi 
T. 而 估 也 绝 不 会 再 有 ， 因 为 第 三 个 SIGCHLD 的 所 有 入 息 都 已 经 丢失 了 。 出 此 得 到 的 重要 教训 是 ， 
信号 不 可 以 用 来 对 其 他 进程 中 发 生 的 事件 计数 ， 

为 了 惨 下 这 个 问题 ， 我 们 忆 须 回想 -- 下 ， 存 在 一 个 待 处 理 的 信号 只 是 赔 示 自 进程 若 厂 “次 收 到 
一 个 信号 以 来 , 至 少 已 经 有 一 -个 这 和 神 类 型 的 入 号 被 发 送 了 。 所 以 我 们 必须 修改 SIGCHLD ЖЕГЕ, 
ERR SIGCHLD 椒 埋 程序 被 调用 时 ， 回 收 尽 可 能 名 的 伪 死 子 进程 。 图 829 Ros [W DJ 


SIGCHLD 处 理 程 序 。 
code/ecf/signal2.c 
1 3include "csapp.h" 
Р; 
3 volc handler2[int sig! 
4 I 
5 pid t pid; 
5 
7 while {ipid = waitpid(-1, NULL, 01) > 0) 
8 printfi"Handier reaped child %Д\п", ‘іпі)ріа}; 
9 it [(errno !- ECHILD) 
10 unix errorí("waitpid error'!; 
1- 51еер(2); 
12 return; 
13 ) 
14 
15 int maini) 
16 1 
17 int i, п; 
18 char buf [MAXBUF': 
19 


20 if (signal(SIGCHLD, handler2) == SIG, ERR) 
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21 unix errorí"'signal error"): 

22 

23 {* parent creates children */ 

24 tor {і - 0; i < 3; i++} Í 

25 if (Forki) == б} | 

26 printfí("Hello from child 9dn", (intlgetpid(]]; 
27 51еер{1); 

28 exiti|0); 

29 ] 

E } 

11 

32 f* parent waits for terminal input and then processes it */ 
i3 itf ((n = read(STDIN FILENO, buf, sizeof(buf]j) < Q) 
34 unix errorí"read error"): 

35 

36 printfí('Parent processing lnputin"); 
47 while 11) 

38 : 

39 

40 ехі {0}; 

41 } 


code/ecffsignal2.e 


8.29 signo 
Ei 828 的 ож, ЕРЕН АШ ЖН ЕНИН. RE ТЕН Е КИЕВА ИГЕН. 


当 我 们 在 Linux 系统 上 运行 signal2 时 ， 它 可 以 王 确 她 回收 所 有 的 僵 死 子 进 程 了 。 


linux» ./signal2 

Hello from child 10378 
Hello from child 10379 
Hello from child 10380 
Handler reaped child 10379 
Handler reaped child 10378 
Handler reaped child 10380 
«Сг 

Parent processing input 


тп, ЖАН GREC A. WE Solaris 系统 上 运行 signal2 程序 ， 它 会 正确 地 回收 所 


AUETA. 然而 ， 现 在， 被 阻塞 的 read 系统 调用 在 我 们 在 键盘 上 进行 输入 之 前 ， 提 前 返回 一 
个 错误 : 


Solaris» ./signal2 

Hello from child 18906 
Helio £rom child 189(7 
Hello from child 189C8 


540 3: 8 +} 





Handler reaped child 18906 
Handler reaped child 18908 
Handler reaped child 18907 
read: Interrupted system call 


НОРА АЕ? 出 现 这 个 问题 是 因为 在 这 个 Solaris ЖБ, ЖІП read 这 样 的 慢 速 系统 调用 
全 被 信号 发 送 中 断后 ， 是 不 会 自动 重启 的 。 相 反 地 ， 和 Linux 系统 自动 重启 被 中 断 的 系统 调用 不 同 ， 
它们 会 提前 退回 给 调 败 应用 程序 一 个 错误 条 件 。 

为 了 网 与 可 移植 的 信 叶 处 理 代码 , 我 们 必须 考虑 系统 调用 过 嘻 返 回 , 然后 于 动 重启 它们 的 情况 。 
4 8.30 展示 了 对 signall 的 修改 ， 它 会 手动 地 重 语 被 终止 的 read iAH. ermo TH EINTR 返 同 代码 
表明 read 系统 调用 在 它 被 中 断后 提前 返回 了 。 





code/ecf/signal3.c 
1 include "csapp.h" 
2 
E void handler2(int sig! 
4 i 
5 pid i pid; 
5 
/ while (ípid = waitpidí(-., NULL, 0) > O) 
8 printfi("Handler reaped child &dMn", (int)pid); 
9 if {errno != FCHILD) 
10 unix error("waitpid error"): 
11 Sleepí2]; 
12 return; 
13 ) 
14 
15 int maini) 1 
16 int i, n; 
17 char buf [MAXBUF]; 
18 pid t pid; 
19 
20 if [signal(SIGCELD, handler2) == SIG ERR) 
21 unix errori"signal error"); 
22 
23 /* parent creates children */ 
24 tor {i = Ü; i < 3; i++ 1 
25 pid = Forki}; 
25 if (pid == 0) { 
27 |: printf{"Hello from child $din", (int)getpidi)]; 
28 Sleepili: 
28 exit (0); 
30 ) 
31 ) 
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33 /* Manually restart the read call if it is interrupted %/ 

34 waile (іп = read(STDIN FILENO, buf, sizëot(buf))) < 0) 
35 if (errno != EINTR) 

3B unix error;"read error"); 

37 

38 printfí["Parent processing inputin"); 

39 while [1! 

AQ ; 

41 

2 ех1Е (0); 
43 Н 

code/ecf/signal3.c 
ЕҢ 8.30 signal3 


Щ 8290 个 改进 版 二 ， 它 正确 地 解决 了 系统 调用 可 能 被 中 上 断 的 情况 。 
当 我 们 在 一 台 Solaris 系统 上 运行 我 们 新 的 signa 程序 时 ， 称 序 会 正确 运行 ; 


solaris» ./gsignal3 

Hello from child 19571 

Hello from child 19572 

Hello from child 19573 

Handler reaped child 19541 

Handler reaped child 19572 

Handler reaped child 19573 

CD 

Parent processing input 
8.5.5 ”可 移植 的 信号 处 理 

不 同系 统 之 间 ， 信 和 号 处 理 语 义 的 差异 一 一 比如 一 个 中 断 慢 速 系统 调用 是 否 重启 或 者 永久 放 
JF—— & Unix 信号 处 理 的 一 个 缺陷 。 为 了 处 班 这 个 问题 ，Posix 标准 定义 了 sigaction М, € 
ЖҮР Posix HARADA, Ai Linux 和 Solaris 的 用 户 ， 莫 式 地 指定 他 人 科 忆 要 的 信号 处 理 语 
X. 


| #include <signal. h> 





int sigacrion[int signum, struct sigaction *act, struct sigaction *oldact); 

=; ERAJ 0-1. 
sigaction ЖЖСАНЖАЫ, 因为 它 要 求 用 户 设 置 一 个 结构 的 项 日 (entry), 7 REEL Ду. 

ЖЛЕ Stevens 提出 的 [81], 就 是 定义 一 个 包装 (wrapper) 函数 , 称 为 Signal 它 为 我 们 调用 sigaction。 

图 8.31 给 出 了 Signal 的 定义 ， 它 的 调用 方式 与 signal 函数 的 调用 方式 - - 样 ，Signal REGIE T 

一 个 疆 号 处 型 程序 ， 其 信 吴 处 型 语义 如 下 : 

б 只 有 这 个 处 理 程序 当前 正在 处 理 的 那 种 类 型 的 信号 被 阻塞 ， 

° 和 所 有 信号 实现 一 样 ， 信 号 不 会 排队 等 待 。 
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€ 只 要 可 能 ,被 中 断 的 系统 调用 会 自动 重启 。 


SIG DFL 被 调用 。( 一 些 比较 老 的 Unix 系统 会 在 一 个 处 理 程序 处 理 完 一 个 信号 之 后 ， 将 信 
号 行为 恢复 为 它 的 默认 行为 ,) 


code/src/csapp.c 


1 handler t *Signalíint signum, handler t *Landler; 

2 { 

E sLruct sigaction action, old action; 

à 

5 acticn.sa handler = handler; 

5 sigemptyset:&action.sa, maski; /*block sigs of type being handled */ 
7 action.sa flags = 5A RESTART; /* restart syscalls if possible */ 
B 

9 12 (sigaction[signum, &action, &old action) < 0) 

10 unix errorí"Signal error"); 

11 return [old action.sa handler]; 

12 | 


code/src/csapp.c 


ЖІ 8.31 Signal 
sigaction 的 -- 个 包装 函数 ， 它 提供 Poi EE Peru tisti Dp AERE, 


图 8.32 展示 了 图 8.29 中 signal2 程序 的 一 个 版 本 ， 谅 版 本 使 用 我 们 的 Signal 包装 函数 在 不 同 的 计算 
机 系统 上 获得 同 预 铀 的 信号 处 至 语义 。 惟 一 的 区 别 是 我 们 是 通过 调用 Signal 而 不 是 调用 signal 来 设置 处 
BPFE ME, EFRO Solaris 也 可 这 在 Linux 系统 上 | 正确 运行 了 ， 谭 我 们 也 木 诺 需要 手动 地 重 
ЛАТ read 系统 调用 了 ， 





code/ecf/signald.c 
1 tinclude "csapp.h" 
2 
3 void handler2(int sig! 
4 1 
5 pid t pid; 
Б 
7 wnile {ipid = waitpidi-1, NULL, 0)) > 0) 
8 printf("Handler reaped child %dxXn", (int pid); 
9 if (errno !- ECHILD) 
19 іпіх error["waltpid error"); 
11 51еер[2); 
12 return; 
13 } 
14 
15 int mainí) 
16 { 
1” int i, n: 
18 char buf [MAXBUF] ; 
19 pid_t pid: 


# 38 i 543 
20 
21 Signal(SIGCHLD, handler2); /*sigaction error-handling wrapper */ 
22 
23 /* parent creates children */ 
24 for (i = 0; i < 3: i++} Í 
25 pid = Fork(); 
2б it ipid == 0) 1 
27 printfi"Hello from child %dyn", iintigetpidi{}}); 
28 Sleepiíll; 
29 exit(0); 
30 ) 
31 } 
32 
33 /* parent waits for terminal input and then processes it */ 
34 if [in = read(STDIN,FILENO, buf, sizeof(bu£);) < D) 
35 unix errorí"read error"); 
ib 
37 printf["Parent processing input'in"); 
38 while 41) 
35 : 
49 ехії 107; 
A]  j 

codefecf/signald. с 


图 8.32 signaM 
图 8.29 的 一 个 版 本 ， 该 版 本 通过 使 用 我 们 的 ignal 包装 西数 得 到 可 称 植 的 信号 处 理 语义， 


856 ДАНЕ 
应 奈 程 序 可 以 使 用 sigpromask 函数 是 式 地 阳 塞 和 取消 阻塞 选择 的 信号 ; 


#include «signa..h» 


int sigprocmask!int how, const sigset t *set, sigset t *oldseL;; 
int sigemptysetisigset t *set); 

int sigfillsetí(sigset t *set); 

int sigaddse-(sigset t *set, int signum); 

їп: sigdelsetí(sigset, t *set, int signum); 


E: $e xp x» 0. ЖЕН 9-1. 


int sigismember(const sigset і *set, int signum); 


ik): Ж signum X 8 时 的 成 员 则 为 1， 若 出 错 则 为 О, 
sigpromask 图 数 改变 当前 已 阳 塞 信号 的 集合 (blocked 位 向 量 在 8.5.1 节 中 描述 )。 上 只 体 的 行为 依 


Ж-Е how THE: 
* SIG BLOCK: WRAN set 中 的 信号 到 blocked 中 (blocked-blockediset?. 


+ SIG UNBLOCK: А blocked 中 删除 set THT S (blocked-blocked& set), 
s SIG SETMASK: blocked-set. 


ЖЖ oldset JEF, blocked 位 向 量 以 前 的 值 会 保存 在 oldset H, 


544 # 4% 


ир H T FER EBR set 这 样 的 信号 集合 。sigemptysel 初始 化 set 为 空 集 。sigfillset AAH 
每 个 信号 诊 加 到 set T .sigaddset rf Sri Jm signum 到 set, sigdelset 从 set ТІН signum. WE: signum 


是 set ЈАК, WA sigismember 返回 ]， 反 之 则 返回 0， 


sigprocmask 队 数 对 于 同步 父 了 进程 是 很 方便 的 。 比如， 考虑 图 833. 它 总 结 了 一 个 典型 的 Unix 
shell ЈА. ЗН А ЕМИ таге ВУНЕ, А ВЕЕ АТВ ГЕНЕ НТ, ЕЙ, 
32 ЕИ ТАЕ rh. SEE SIGCHLD КЕ ВЕЕ) СЕ) Т 


程 时 ， 它 说 从 作业 列表 中 删除 这 个 子 进程 。 


code/ecfh/procmask.c 


1 void handleríint sig) 

2 { 

3 pid t pid; 

4 while {ipid = waitpidí-1, NULL, 0р) > 0) /*Reapa zombie child */ 
5 deletejob(pid); /* Delete the child from the job list */ 

b if {егүрс != ECHILD) 

7 unix errorí"waitpid error"); 

Ë } 

9 

] int malr(int ағас, char **argv] 

11 í 

12 int pid; 

13 slgset t mask; 

14 

15 SignaliSICGCHLD, handler); 

16 initjoEs(); /* Initialize the job list */ 

17 

18 whiie (1) [ 

19 Sigemptyset (mask); 

20 Sigaddsetí(&mask, SIGCHLD}: 

21 51дргостаѕк (515 BLOCK,&mask, NULL]; /* Block SIGCHLD */ 
22 

23 /* Child process */ 

24 if {ipid = Fork()) == б] Í 

25 Sigprocmask(SiG UNBLOCK,&mask, NULL); /* Unblock SIGCHLD */ 
26 Execve("/bin/ls", argv, NULL]: 

2d ) 

AU 

29 /* Parent process */ 

30 addjobí(pid]; /* Add the child to the job list */ 

3l Sigprccmaskí(SIG UNBLOCE,&mask, NULL); /*Unblock SIGCHLD */ 
32 J 

33 exi-í0); 

34  ) 





B] 8.33 В sigprocmask 来 同步 进程 
Binpi, HRT HE deletejob 之 前 保证 执行 了 addjob. 


code/ecffprocmask.c 
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ШЫП АЛТЫН ГЕ, МАМ ЕКЕ ТП ТИНИ: 
. SERE fork AA, HARME ТАО ИЕ C Fla АТ 
° и а, TARARE HAR- NEDER, RERBA 
SIGCHLD 信和 号 给 父 进程 。 
* 后 来 ， 当 父 进程 再 次 变 成 可 运行 但 又 在 它 执行 之 前 ， 内 核 注 意 到 符 处 理 的 SIGCHLD 信和 号， 
并 通过 在 父 进 程 中 运行 处 理 程 序 接收 这 个 信号 。 
. 处 理 程序 回收 终止 的 了 进程 ， 并 调用 deletejob， 这 个 汕 数 什么 也 不 做 ， 因为 父 进程 还 没有 把 
该 了 进程 添加 到 列表 中 。 
. 在 处 理 程序 运行 完毕 后 ， 内 核 运 行 父 进程 ， 父 进程 从 fork 返回 ， 通 过 调用 addjob 错误 地 把 
(不 存在 的 ) 子 进程 添加 到 作业 列表 中 ， 
关键 问题 足 如 果 我 们 什么 都 不 做 ， 那 么 就 可 能 在 执行 addjob 之 前 ， 执 行 deletejob。 图 8.33 展示 
了 改正 这 个 问题 的 一 种 方法 。 通 过 在 调用 fork 之 前 , 阻塞 SIGCHLD 信号 , 然后 在 我 们 调用 了 addjob 
СОҒАН 08905, Su Ir ГЕНЕ ТЕУІ PZ a. EID. 
注意 了 进程 继 革 了 它们 多 进程 的 被 阻塞 集合 ， 所 以 我 们 必须 在 调用 execve 之 前 ， 小 心地 解除 子 
进程 中 阻塞 的 SIGCHLD 信号 。 


8.6 ” 非 本 地 跳 转 


C 提供 了 一 种 形式 的 用 广 级 异常 控制 流 ， 称 为 非 本 地 跷 转 nonlocal jump}， 它 将 控制 直接 从 一 
个 泊 数 转移 到 男 一 个 当前 正在 执行 的 函数 ， 而 不 需要 经过 正常 的 调用 -返回 序列 。 大 本 地 诛 转 是 通 
过 setjmp 和 longimp 函数 来 提供 的 ， 


#include «setjmp.h» 


int setjmpinmp buf env); 
int sigset mpísigjmp buf env, int savesigs): 
х8 0]; setjmp i& B] Q. longimp i 


setjmp 半数 在 env 组 冲 区 中 保存 当前 栈 的 内 容 ， 以 供 后 面 longjmp 使 用 ， 并 返 可 0. 


#include «setjmp.h» 





void longjmpíjmp buf env, int retval); 
void siglongimpiísigjmp buf env, int retval}: 





longjmp 6 env 9 КЕИ Ж. ЖЕЖ -个 从 最 近 一 次 初始 化 env 的 setjmp 调 
HERRE. ЖҮН setjmp 35 [2], ЖР JEF ЈЕ [B| $Ë теуді. 

第 一 眼看 过 去 ，setjmp 和 longimp 2 АНН ЖА А8, setjmp 函数 只 被 调用 一 次 ， 但 返 
回 多 次 一 一 - 次 是 当 第 一 次 谢 用 setjmp， 而 栈 的 上 下 文保 存在 缓冲 区 env 中 时 ， 一 次 是 为 每 个 相 庶 
的 longjmp。 荔 -~ 方面 ，longjmp 函数 只 被 调用 一 次 ， 但 从 不 返回 。 

非 本 地 跳 转 的 一 个 重要 应 用 就 是 允许 从 - -个 深层 嵌 丢 的 函数 调用 中 立即 返回 ， 通 常 是 由 检测 到 


546 $353 


AC xo ER. UR TE— TREE ЕКЕ НУ Ра 8189 ЧТ УЕ Т 一 个 错误 情况 ， 我 们 可 以 使 用 非 林 
地 路 转 焉 接 返 问 到 一 个 普通 的 本 地 化 的 错误 处 理 程 序 ， 而 不 是 费力 地 解 开 调用 酸 ， 

图 8.34 展 东 了 一 个 示例 ， 说 明 这 避 能 是 如 何 上 作 的 ，main 函数 首先 调用 setjmp 以 保存 当前 栈 
f LX. ЖЕШ foo. foo НЕЕ bar. WẸ foo 或 者 bar Aa- 个 错误 ,它们 立即 通过 
一 次 longimp 调用 从 setjmp 22 [8]. ѕејтр 的 非 鹤 返回 值 指明 了 得 误 闫 型 ， 随 后 可 以 被 解码 ， 及 在 代 
fart ЫРА CETT AERE. 


code/ecf/setjmp.c 
1 #include "csapp.h" 
2 
3 jrp, buf buf; 
4 
5 int errorl = 0; 
Ё jrt error2 = 1; 
8 void foo:void)], bar(void!; 
9 
10 int malni) 
11 f 
17 int rc 
13 
14 rc = setjmpíbuf); 
15 if irc == 0) 
16 fool); 
17 else if irc == |) 
18 printfi"'"Detected ап errorl condition in foo'in"); 
13 eise lf (rc == 2) 
20 printfi"Detecied an error? condit on in foo'n"H 
21 else 
22 printfi"Unknownz error condition in foosn"); 
23 exitio: 
24 ) 
4b 
26 Ї* deeply nested function foo */ 
27 void Fooivoid) 
2 | 
29 „Т (егтог1) 
30 longjmpíbuf, 1); 
3] barí]; 
32 | 
33 
34 void ba-([(voild) 
35 { 
ip 1f (errori! 
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29 longjmnpibuf, 2}; 
38 } 


code/ecf/setimp.c 


8.34 ТАЗ RE BI 
这 个 示例 表明 [AE HTAE ЖАЙ ЖАНКЕНТ НАНЫН. ПАЖЕНЛЕТРНІН ЖАН, 


ЗЕ Haber 5 5 — 138 XE PVP E 16 — in REIR 8I PRSE UE m EET 
到 被 信号 到 达 中 断 r WB ТИ RE. PE 835 展示 了 -- 个 简单 的 程序 ， 说 明了 这 种 基本 技术 。 当 用 广 
在 键盘 上 键入 ctl-c 时 ， 这 个 程序 用 信和 号 和 非 本 地 跳 转 来 实现 软 重 启 。sigsetimp 和 sigiongjmp 函数 
是 setjmp 和 1longjmp 的 可 以 被 信号 处 理 程 序 使 用 的 版 本 ， 





code/ecf/restart.c 
1 Éinclude "csapp.h" 
2 
3 siginp buf buf; 
4 
5 void handlerlint sig! 
6 i 
K; siglongjmp(buf, 1); 
8 } 
9 
10 int mainí) 
1. { 
12 Signal (SIGINT, handler); 
1i 
l4 it ('sigsetjmpíbuf, 1)) 
15 printfí"startingin"); 
15 else 
17 printfí"restartingMn"); 
18 
19 while(1) í 
26 Sleep(1); 
21 printfi"processing... Am"); 
22 | 
23 exit (0); 
24 | 

code/ecf/restart.c 


48.5 HAARA cilc 时 ， 一 个 使 用 非 本 地 跳 转 来 重启 动 它 本 身 的 程序 


在 程序 第 一 次 启动 时 ,对 sigsetimp 国 数 的 初始 调用 保存 了 栈 和 信号 的 上 下 文 。 随 后 ， 主 函数 进 
入 一 个 无 限 处 理 循环 。 当 用 户 键入 сшї-с WJ, shell 发 送 一 个 SIGINT 全 号 给 这 个 进程 ， 该 进程 捕获 
这 个 信号 。 不 是 从 信号 处 理 程序 返回 ， 此 时 信号 处 理 程 序 会 将 控制 返回 给 被 中 断 的 处 理 循环 ， 取 而 
Қожа, 处理 程序 执行 - -个 非 本 地 跳 转 ， 回 到 main 函数 的 开始 处 。 当 我 们 存 系统 上 运行 这 个 程序 
时 ， 我 们 得 到 以 下 输出 : 
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unix» ./restart 
starting 
processing... 


processing... 
restarting user hits ctri-c 
process.ng... 
restarting User hits ctrl-c 


process ng... 


Sit: C++3 Java 中 的 软件 异常 

C++ 和 Java 提供 的 异常 视 制 是 较 高 层次 的 ,是 已 的 setimp 和 longjmp 3d 8f E dud HS CAS, 
你 可 以 把 try 3 61 Р 85 catch + 61 E E. setjmp AA M o, 38403, throw 语句 就 类 局 于 longjmp 
ж. 


87 ”操作 进程 的 工具 


Unix 系统 提供 了 估量 的 监控 和 操作 进程 的 有 用 工具 ; 

strace: 打印 一 个 程序 和 它 的 了 进程 调用 的 每 个 系统 调用 的 轨迹 。 对 于 好 奇 的 学 生 而 埋 , 这 是 一 
АЖА! 具 。 用 -static 编译 你 的 程序 ， 能 得 到 一 个 更 清楚 的 轨迹 ， 而 不 带 有 人 基 与 共享 库 相 
A Bd 

ps: ДІН АЙЫН ИНЕ Ch ИОК}. 

top: ТЕПСЕ НЕ ИЕ НАНЕ В. 

kill: 攻 达 “个 信号 给 进程。 对 十 调试 带 倩 号 处 理 程序 的 程序 以 及 清除 难以 琢磨 的 进程 是 非常 有 
Rim. 

Iproc (Linux 机 Solaris): — T ИЖ Ж. 0 ASCI 文本 格式 输出 估量 内 核 数据 结构 的 内 
T. ДИ" ЖЕГЕН] PT ШЕРІ, НАП, 58 "cat/proc/loadavg "， 观 察 在 你 的 Linux 系统 上 当前 的 
FHAR. 


88 小结 


开 常 控制 流 发 生 在 计算 机 系统 的 各 个 层次 。 在 胡 件 层 ， 异 常 是 由 处 理 器 中 的 事件 触发 的 控制 流 
中 的 突变 。 控制 流 传递 给 一 个 软件 处 百 程 序 ， 该 处 理 程 序 进行 一 些 处 理 ， 然 后 返回 控制 给 被 中 断 的 
控制 流 ， 

有 四 种 不 同 奖 型 的 异常 :中断 、 故 障 、 终 目 和 陷 圣 。 当 一 个 外 部 的 ОА, ИШЕНЕН 
或 者 一 个 磁盘 控制 器 ,设置 了 处 理 器 蕊 片上 的 中 断 管 脚 时 ，( 对 于 任意 指令 ) 中 断 会 异步 地 发 生 。 控 
制 返回 到 中 断 指令 “的 下 一 条 指令 。 执 行 一 条 指令 可 能 导 敏 故障 和 终止 的 发 生 。 故 障 处 理 程 译 会 重 
新 开始 故障 指令 ， 市 终止 处 理 程序 从 厅 将 控制 返回 给 被 中 断 的 流 。 最 后 ， 陷 阱 就 像 是 用 来 实现 系统 
调用 的 函数 调用 ， 系 统 调 奈 提 傣 给 应 用 到 标 作 系统 代码 的 受 挖 入口 点 。 


2 RLAR. —— 
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作 操 作 系统 层 ， 内 核 提 供 头 于 一 个 进程 的 基础 性 概念 。 一 个 进程 提供 给 应 用 两 个 重要 的 抽象 ， 
逻辑 控制 流 ， 它 提供 给 每 个 程序 -个 假象 ， 好 像 它 是 在 独占 地 使 用 处 理 器 ， 抱 私有 地 址 空间 ， 它 
提供 给 每 个 程序 一 个 假象 ， 好 像 它 是 在 独占 地 使 用 主 存 ， 

在 操作 系统 和 应 用 之 间 的 接口 处 ， 应 用 可 以 创建 子 进 程 ， 等 竺 它们 的 子 进程 暂停 或 者 终止 ， 运 
行 新 的 程序 ， 并 捕捉 来 日 其 他 进程 的 信号 。 信 号 处 理 的 语义 是 微妙 的 ， 并 且 随 系统 不 同 而 不 同 。 然 
而 ,在 与 Posix 兼容 的 系统 上 存在 着 一 些 机 制 ， 允 许 程序 清楚 地 指定 期 望 的 信号 处 理 语义 ， 

最 后 ， 侍 应 用 层 ，C 程序 可 以 使 用 非 本 地 跳 转 来 规避 正常 的 调用 /返回 栈 规 则 ， 并 且 直 接 从 一 个 
KE X3 TAR. 


参考 文献 说 明 

Intel 征 体 系 结构 规范 包含 对 Intel 处 理 器 上 的 异常 和 中 断 的 详细 讨论 [18]。 操 作 系统 教科 书 [70， 
75， 妈 ] 包 括 关 于 异常 、 进 程 和 信号 钓 其 他 信息 。Stevens 的 经 典 著作 [76]， 虽 然 有 点 过 时 了 ， 但 是 仍 
然 包 人 窜 一 些 有 价值 的 和 可 读 性 很 高 的 摘 述 ， 是 关于 如 何在 应 用 程序 中 处 理 齐 程 和 信号 的 。 


REFE 

B8 € 

EX 章 里 ， 我 们 介绍 了 一 些 有 不 寻 常 的 调用 和 返回 行为 的 函数 :setimp、longjmp、execye 和 
fork。 找 到 下 列 行为 中 和 每 个 通 数 相 匹配 的 一 种 ， 

А. 调用 一 次 ， 返 回 两 次 。 

В. 调用 一 次 ， 从 不 返回 。 

C. 调用 一 次 ， 返 回 一 次 或 者 多 次 。 


89 € 
下 面 程序 的 可 能 前 输出 是 什么 ? 
code/ecf/forkprob3.c 
1 #lnclude "сварр.һҺ” 
2 
3 int maini} 
4 | 
5 int x = 3; 
Š 
7 itf iFork() != 0) 
8 printfí("x-&din", ++х); 
9 
10 printf("x-€din", --х); 
11 exit(0); 
12 } 
code/ecffforkprob3.c 
8.10 € 


站 面 这 个 程序 会 输出 多 少 个 “hello” 输 出 行 ? 


350 


68% 


1 tinclude "csapp.h" 
2 
3 void doiki} 
4 I 
5 if (For<í) == 0) Í 
Š Forki}. 
7 printfí("helloin";; 
8 exit(Üüi: 
3 ] 
10 return; 
1l | 
13 
13 int maini} 
14 | 
15 doití!; 
16 print£("he-loin"); 
17 exitii]; 
15 |} 
8.11 % 


下 面 这 个 程序 会 输出 多 少 信 “helio” 输 出行 ? 





#`nclude "csapp.h" 


void doit!) 


i 
11 {Forkt) == J} | 
Forsi); 
printfi"helloin"); 
return; 
) 
return; 


int maini, 

I 
d3doitl); 
printfí"hellosn"); 
exitii}; 


code/ecffforkprob5.c 


code/ecf/rorkprob5.c 


code/ecf/forkprobt.c 


812 #4 
КЕН ЖА? 
1 tinclude "csapp.h" 
2 int counter = 1; 
3 
4 int maini) 
5 { 
b if (forkí() == O) í 
? counter--; 
8 ёх15[0); 
9 ] 
1C else { 
11 Wait (NULL! ; 
12 printfí("counter = fdn", 
13 } 
14 exit (C); 
15 ] 
8.13 Ф 
列举 练习 题 8.4 中 程序 所 有 可 能 的 输出 。 
8.14 %% 
考虑 下 面 的 程序 ， 
1 *include "csapp.h" 
2 
3 void endí(veid) 
d 1 
5 orintfí"2"); 
Ü } 
B int mair i) 
9 { 
10 if Forki} == 0) 
11 atexit {end}; 
12 if !Fork() == 0) 
13 printti"0'j; 
14 alse 
15 printf("1"); 
15 ехі {0}; 
17 ) 
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code/ecf/forknrob. c 


code/ecifforkprob7.c 


code/ecf/forkprob2.c 


code/ecffforkprob2.c 
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判断 下 面 哪个 输出 是 可 能 的 。 注 意 ，atexit ВАСА — TR пй CR TREE АША, ЛЕТИЯ 
数列 表 中 【初始 为 空 )， 当 exit 函数 被 调用 时 ， 会 调 州 该 询 表 中 的 函数 。 
А. 112002 
В. 211020 
‚ 102120 
. 122001 
E. 100212 


815 %% 

使 用 execve #85 — ШЧ туз 的 程序 ， 该 程序 的 行为 和 APbirvls 程序 的 - 样 。 你 的 程序 应 该 接 
受 相 同 的 命令 行 参 数 ， 解 释 同 样 的 环境 变量 ， 并 产生 相 问 的 输出 。 

ls 程序 是 从 COLUMNS 环境 变量 中 效 悉 屏幕 的 党 度 的 。 如 果 设 有 设置 COLUMNS. MA Is 会 
BOREAS Во 列 。 因 此， 你 可 以 通过 把 COLUMNS 环境 设置 得 小 于 80， 来 检查 你 对 环境 变量 的 处 
В. 


unix» setenv COLUMNS 40 
unlx» ./Imyis _ 
. output is 40 columns wide 
unix» unsetenv COLUMNS 
unix ./myis 


шт 


‚ Outout is now 80 columns wide 
8.15 %Ф%% 
579 845 БЕЛТ. ЕЕ КЕЗЕН. 
|l. 每 个 子 进程 在 试图 写 ARERR PERENE RMA. 
2. 父 进 程 打印 和 上 下面 所 未 相同 《除了 PID) 的 输出 ; 
child 12255 terminated by signal 11: Segmentation fault 
child 12254 terminated by signal 11: Segmentation fault 


лч: BOE wait(2)8 psignal(3)f] man H. 

817 999 

ЖАН CLA ARP] Unix system ЖЖ: 

int mysystemí(char *command)!; 

mysystem #081199 “bin/sh — command" 来 执行 command， 然 后 在 command 完成 后 返回 。 
如 果 command 正常 进出 (通过 调用 exit AARE BUT 7 reum 1852. 那么 mysystem 返回 command 
的 退出 状态 , 比 姑 ,如 有 果 command 通过 调用 exit(8) 终 止 , 那么 mysystem A FHE 8 «358 lJ, hu Ж command 
ЖЕМІН, WA mysystem APH shell 返回 的 状态 。 

618 € 

你 的 一 位 同事 正在 考虑 使 用 信号 来 允许 一 个 父 进程 计算 了 进程 中 发 生 的 事件 数 ， 基 本 思路 是 每 
次 一 个 事件 发 生 时 ， 通 过 发 送 个 信号 来 通知 父 进 程 ， 并 且 让 父 送 程 的 信号 处 惠 程 序 增加 全 局 变量 
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counter， 爷 进程 随后 可 以 在 子 进程 终止 时 检测 该 变量 。 然 而 ， 当 在 系统 上 运行 图 8.36 中 的 测试 程序 
时 ， 他 发 现 当 父 进 程 调用 printf If, counter 总 是 保持 一 个 值 2?， 即 使 是 子 进程 已 经 发 送 了 5 个 信和 号 
给 父 进 程 。 带 着 困惑 ， 他 来 同 你 求助 。 你 能 解释 一 下 这 个 程序 有 什么 错误 吗 ? 
—— ——— odwecpromterprob.c 
Kinclude "csapp.h" 


int counter = 0; 


1 

2 

3 

4 

5 void handler {int sig! 
6 ( 

7 

B 

9 





counters; 

sleepíl); /*dosome work in the handler */ 

return; 
10 } 
11 
12 int main() 
13 { 
14 int i; 
15 
18 Signa.(SIGUSR2, handler); 
18 if (Fork() == 0) { Æ child */ 
19 for (i = Ú; i < 5; 1++) Í 
20 Kill(getppid(), SISUSR2); 
21 printfí"sent SIGUSR2 to parent Am"); 
22 } 
23 exit (0); 
24 } 
25 
20 Wait (NULL) ; 
27 nrintf("counterz&din", counter); 
28 exit 0); 
29  ] 

code/ecf/counterprab.c 
图 8.36 图 8.18 中 引用 的 技术 程序 
B.19 %Ф%% 


编号 fgets 前 数 的 一 个 版 本 ， 叫 做 tfgets， 它 5 秒 钟 后 会 超时 。ttgets 函数 接收 和 fgets 相同 的 输 
入 。 如 果 用 户 在 5 秒 内 不 键入 -- 个 输入 行 , tfgets iE [S] NULL, 否则 , 它 返回 一 个 指向 输入 行 的 指针 。 
820 9999 


以 图 8.20 中 的 示例 作为 开始 点 ， 编 写 РЕЧИ ИУ shel 程序 。 你 的 shell 必须 具有 以 下 


554 


ER: 





用 产 答 入 的 命令 行 由 一 个 name、 索 个 或 者 多 个 参数 组 成 ， 所 有 的 者 是 由 一 个 或 者 多 个 空格 
分 隐 开 的 。 如 果 name 是 一个 内 置 命令 ， 那 么 shell 就 立即 处 理 它 ， 并 等 待 下 一 个 命令 行 ， 
否则 ，shell 就 假设 name 是 个 可 执行 的 交 忻 ， 在 一 个 初始 的 了 进程 作业) 的 上 下 文中 加 
郝 并 运行 加。 作业 的 进程 组 ID 与 了 进程 的 PID НІНІ. 

每 个 作业 是 由 一 个 进 各 ID (PD 或 者 一 个 作业 ID. (Лр) 来 标识 的 ， 它 是 所 一 个 shell 分 
BUR SERIES. ЛО EmA ir LAIR o” 来 表示 。 БП, “95° dw JID 5, mi ^5" 
ж PID 5. 

ana ТАКЖЕ, SUA shell 就 在 后 台 运 行 这 个 作业 ， 否 则 ，shell 在 前 台 这 行 这 个 作 
业 。 

输入 ctrl-c Ссіп-2), (49 shell 发 送 一 个 SIGINT (SIGTSTP) 信号 绽 前 台 进 程 组 中 的 每 个 进 


Ж. 
° 内 次 命令 jobs AITA UR & TENE. 


° 内 置 命令 bg <job> 通 过 发 送 一 个 SIGCONT 信号 重 户 <job>， 然 后 在 乒 台 运行 它 。<job> 参 数 


可 以 是 一 个 PID， 也 订 以 是 一 个 HD. 
。 PUE f fg <job> 通 过 发 送 一 个 SIGCONT 信号 重启 <job>， 然 后 在 前 台 运 行 它 ， 


° shell 回收 它 所 有 的 候 死 子 进程 。 如 果 任 何 作业 因为 它 收 到 … 个 术 搬 所 的 信和 号 而 终 目 ， 邦 么 


shell нің “条 合 鼠 到 终端 ， 包 食 该 作业 的 PID ЖЕНЕ КШ. 
图 8.37 展 术 了 一 个 示例 的 shell 会 话 。 


unix> ней Run your shell program 
» bogus 


bogus: Command not found. Ехесуе can i find executable User types ctrl-c 
> foo ID 

Jób 5035 terminated Бу signal: Interrupt 
> foo 100 & 

[1] 5036 foo 100 & 

> foo 200 & 

[2] 5037 foo 200 & 

> Jobs 

[1] 5036 Running foo 100 в 

[2] 5037 Running foo 200 k 

> fu b] 

«ob [1] 5036 stopped by signal: Stopped User types ctri-z 
» Jobs 

[1] 5035 Stopped foo 100 & 

[21 5037 Running foo 200 & 

> bg5035 

5035: No such process 

> bg5036 

[1] 5038 foo 100 & 

> fbiwvkill 5036 

Job 5036 terminated by signal: Terminated 
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> fg $2 Wait for fg job to finish. 
> guit 
unix Back to the Unix shell 


8.37 SI 820 的 shell 交互 示例 
A) Ж 


5 2188 8.1 答案 

在 我 们 图 8.13 中 的 示人 重 程序 中 ， 父 子 进程 执行 无 关 的 指令 集合 。 然 而 ， 在 这 个 程序 中 ,父子 进 
程 执行 的 指令 集合 是 相关 的 ， 这 是 有 可 能 的 ， 因 为 父子 进程 有 相同 的 牧 码 段 。 这 会 是 一 个 概念 上 的 
障 码 ， 所 以 请 确认 你 理解 了 本 蚜 的 答案 ， 

A. 了 进程 的 输出 是 什么 ?这 时 的 关键 点 是 子 进程 执 行 了 两 个 printf 语句 。 ТЕ fork 返回 之 后 ， 
它 执行 了 第 8 行 的 printf. 然后 它 从 证 语句 中 出 来 , 执行 了 第 9 行 的 рди 语句 。 下 面 是 子 进程 产生 
的 输出 ; 

printfl: x-2 

printf2: x-1 

B. ИШИН ЛЕП AE? МИЕ НДАР T Ж 9 4183 print: 

printf2: x=0 

练习 题 8.2 答案 


这 个 程序 和 图 8.14 Cc) 中 的 程序 有 相同 的 进程 图 。 一 共有 四 个 进程 , 每 个 打印 .一 个 “hello” 行 。 
因此 ， 程 序 打 印 四 个 “bello” 行 。 


练习 题 8.3 答案 

总 个 程序 和 图 8.14《e) 有 相同 的 进程 图 。 一 共有 四 个 进程 ， 每 个 输出 一 个 单独 的 “hello” 行 在 
doit 中 ,并 且 在 它 从 dot 返回 后 也 在 main 中 输出 一 个 *hello? 行 。 因 此 ,这 个 程序 就 - -共有 八 个 “hello” 

练习 题 8.4 答案 

A. 每 次 我 们 运行 这 个 程序 ， 就 会 产生 六 个 输出 行 。 

B. 和 输出 行 的 鹏 序 根据 系统 不 间 而 不 同 ， 取 决 于 内 核 如 何 交 替 执 行 父子 进程 的 指令 ， MI, 
下 图 的 任意 拓扑 排序 都 是 有 效 的 顺序 ， 


--> ОД” aay 12455 ll» ` ' Bye ' ' 外 进程 


--> 1 414: --> `“Вүе'' THE 


比如 ， 当 我 们 在 系统 上 运行 这 个 程序 时 ， 会 得 到 下 面 的 输出 ， 


unix» ./waitprobl 
Hello 
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Bye 

在 这 种 情况 中 ， 父 进程 首先 运行 ， 在 第 8& 行 打印 “Hello” 在 第 10 4737 E] “07, Ж wait 的 调用 
оН, AATETTA MAART- TE rA MRE ES THE THR 
在 第 10 行 打印 “1”， 在 第 16 行 打印 “Bye”， 然 后 在 第 17 行 终止 ， 退 出 状态 为 2。 企 了 进程 终止 
后 ， 父 进程 继续 ， 在 第 14 行 打印 子 进程 的 退出 状态 ， 在 第 16 行 打印 “Bye”。 


练习 题 8.5 答案 


code/ecf/snooze.c 
1 unsigned int snooze(unsigned int secs) { 
2 ungigned int rc = sleepísecs); 
3 printii"Slept for $u of Фи secs.Xn", secs - rc, secs); 
4 return rc; 
5 


code/ecf/snooze.c 





练习 题 8.6 ЖЖ 
code/ecf/myecho.c 
] include "csapp.h" 
2 
3 int mairíint ағас, char *argv[], char *envp[]) 
4 | 
n int 1; 
б 
7 orintfí"Command line arguments:n"]; 
Ë for {1=0; argv[i] l= NULL; 1++! 
9 printf(" àrgv[€2d]: $s83n", 1, argv[i]); 
10 
11 printrií"Xn"); 
12 printfí"Environment variables:in"): 
13 for {1=0; envp[i] !« NULL; 1++} 
14 printti" envpi*2d]: жазп", i, envp[il); 
15 
16 ex1t (0); 
17 ] 
code/ecf/myecho.c 
练习 题 8.7 答案 


具 区 休 眼 进程 收 到 “个 林 被 忽略 的 信和 导 ,，sieep EGAL iE BIDR IRL, 但是, 国 为 收 到 :个 SIGINT 
信号 的 默认 行为 就 是 终止 进程 《图 8.23)， 我 们 必须 设置 一 个 SIGINT 处 理 程序 来 允许 sleep 函数 返 
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|]. ЖЕ ЕРЕ ЕВ SHIGNAL， 并 将 控制 返回 给 sleep Й, iL ERE Sr BRIT. 


US — c іл gm e о Lr 





code/ecf'snooze.c 
+#include "csapp.hn" 


ж SIGINT handler */ 
void handleríint 519) 
l 


return; /* catch the signa! and return */ 


unsigned irt snoozeíunsigned int secs) Í 
unsigned int rc = sleepíseca): 
printfi"Slept for $u of $u secs.Xn", secs - rc, Sers); 
return rc; 


int mainíint argc, char %%агау) í 


if (arcc l= 2! | 
fprintfí(stüerr, "usage: $s «secs»Mn", argv[0]); 
exit (Q) ; 
] 
if isigral(SIGINT, handler) == SIG ERR) /*install SIGINT handier */ 


"unix errorí("signal erzror*n"): 
(void)snoozetatoi(argvill)); 
ех (OY; 


code/ecf/snooze.c 
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人 们 经 常 同 的 一 个 问题 是 :“ 程 序 X 在 机 器 Y 上 运行 得 有 多 快 ? ”- :个 试图 优化 得 序 性 能 的 积 
序 员 ， 或 者 一 个 想 鉴 决定 买 哪 台 机 器 的 顾客 ， 吕 能 会 提出 这 样 的 问题 ， 在 我 们 前 面 对 性 能 优化 的 讨 
论 中 《第 5 Ж), 我 们 假设 能 够 非常 准确 地 回答 这 个 问题 。 我 们 试图 把 程 迪 和 的 CPE〈 每 元 素 的 周期 
Ж) 测量 值 精确 到 小 数 点 后 两 位 。 对 一 个 CPE 为 10 的 过 程 ， 这 要 求 精确 度 为 0.1%。 在 本 章 中 ,我 
们 会 讲述 这 个 问题 ， 并 会 发 现 它 是 非常 复杂 的 。 

你 可 能 会 以 为 在 计算 机 系统 上 获得 几 近 完美 的 计时 测 基 会 很 简单 。 毕竟 ， 对 于 某 个 程序 和 数据 
的 组 合 ， 机 器 会 执行 认定 的 指令 序列 。 指 令 的 执行 是 由 处 理 器 时 钟 控制 的 ， 而 处 理 器 时 钟 是 由 精度 
振荡 器 抑制 的 。 不 过 ， 一 个 程序 的 块 行 与 另 一 个 程序 的 执行 之 间 有 许多 因素 是 不 同 的 。 计 算 机 并 不 
同时 只 执行 一 个 程序 。 它 们 不 停 地 从 一 个 进程 切换 到 另 一 个 ， 为 一 个 进程 执行 一 些 代 码 ， 然 后 彤 移 
到 卜 一 个 进程 。 对 -个 牲 序 的 处 理 器 资源 的 准确 调度 依赖 于 这 样 一 些 因 素 ， 例 如 共享 系统 的 用 户 数 
量 、 网 络 流量 和 对 磁盘 操作 的 计时 。 对 高 速 缓存 的 访问 模式 不 仅仅 依赖 于 我 们 正在 试图 测 最 的 程序 
的 引用 ， 还 依赖 于 同时 正在 热 行 的 其 他 进程 。 最 后 ， 分 支 预测 导 辑 会 根据 以 往 的 历史 猜测 是 否 会 先 
择 分 支 。 一 个 程序 每 次 执行 的 历史 都 不 相同 。 

在 本 章 中 , 我 们 描述 计算 机 用 来 记录 时 间 流 逝 的 两 种 基本 机 制 ; -种 基于 低频 率 计时 器 (timer )， 
它 会 周期 性 中 断 处 理 器 ， 另 一 种 基于 计数 器 〈counter)， 每 个 时 钟 周期 计数 器 会 如 1. 应 用 称 序 的 种 
序 员 可 以 通过 调用 库 哨 数 获得 对 前 一 种 计时 机 制 的 访问 。 有 些 系 统 上 ， nf PAX ERE eV; d ЛИ 
时 器 《cycle timer)， 但 是 有 些 系统 上 需要 编写 汇编 代码 。 我 们 将 程序 计时 推 壕 到 现在 才 讨 论 ， 是 因 
为 程序 计时 需要 理解 CPU 而 件 和 操作 系统 管理 进程 执行 的 方式 。 

使 用 这 两 种 计时 机 制 ， 我 们 来 研究 获得 程序 性 能 的 可 靠 测量 值 的 方法 。 我 们 会 看 到 ， 由 上 上 下 
文 切换 引起 的 计时 变化 会 非常 太 ， 困 此 必须 消除 。 由 其 他 因素 引起 的 变化 ， ИШӘ ГАЯ ЖЮ 
测 ， 通 常 是 通过 在 精心 控制 的 条 件 下 执行 程序 操作 来 管理 的 。-- 般 来 说 ， 我 们 可 以 获得 对 于 非常 短 

(小 于 大 约 10ms) 或 者 非常 长 《大 于 大 约 is) 的 时 间 段 的 准确 测量 值 ， 即 使 是 在 负载 很 重 的 机 器 
上 。10ms~1s 之 间 的 时 间 要 想 准 确 测 量 需 要 特殊 的 处 理 。 

许多 对 性 能 测量 的 理解 都 是 计算 机 系统 传说 的 一 部 分 。 不 同 的 小 组 和 个 人 开发 了 他 们 自己 的 测 
量程 序 性 能 的 技术 ， 但 是 关于 这 个 主题 没有 广泛 流传 的 文献 。 那些 专业 性 能 测量 的 公司 和 研究 组 ， 
第 常 建立 特殊 配置 的 机 器 ,使 得 造成 计时 不 规则 的 来 源 最 少 , 例如 ， 通过 限制 访问 或 者 关 掉 许多 OS 
种 网络 服务 。 我 们 希望 能 有 程序 员 在 普通 机 器 上 就 能 使 用 的 方法 ， 仍 是 没有 这 样 的 广泛 可 获得 的 工 
具 。 所 以 ， 我 们 会 开发 我 们 自己 的 工具 。 

企 这 里 的 描述 中 ， 我 们 会 系统 地 讲述 这 些 问 题 ， 我 们 描述 估量 实验 的 设计 和 评价 ， 这 些 实验 帮 
助 我 们 获得 在 一 规模 系统 上 取得 准确 测量 的 方法 ，。 企 一 本 这 个 层次 的 书 中 找到 详细 的 实验 研究 还 是 
不 太 常见 的 。 通 常 ， 人 们 只 想 要 最 后 的 答案 ， 而 不 想 知 道 是 怎样 确定 这 些 答案 的 。 不 过 ， 丰 这 里 ， 
对 于 如 何在 任意 系统 上 测量 任意 程序 的 执行 时 间 ， 我 们 不 能 提供 确定 的 答案 。 有 太 多 的 计时 机 制 、 
操作 系统 行为 和 运行 时 环境 ， 不 可 能 有 一 个 惟一 的 、 简单 的 解决 方案 。 相 反 ， 我 们 期 望 你 白 己 做 实 
验 ， 开 发 你 自己 的 性 能 测量 代码。 我 们 希望 我 们 的 案例 研究 能 帮助 你 完成 这 项 任务 。 我 们 把 我 们 的 
发 现 以 协议 的 形式 总 结 出 来 ， 它 能 够 指导 你 的 实验 。 
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计算 机 是 在 两 个 完 爹 不 辐 的 时 间 尺 度 (time scale) 上 于 作 的 。 在 微观 级 则 ， 它 们 以 每 个 时 钟 周 
期 - -条 或 多 条 指令 的 速度 执行 指令 ， 这 里 每 个 时 钟 周期 只 需要 大 约 Ins (ЙД) RA 10%. ЖЖЖ 
有 尺度 上 ， 处 下 器 必须 踢 应 外 部 事件 ， 外 部 事件 发 生 的 时 间 尺 度 要 以 ms СЕМ) 或 者 1076 来 度量 。 
例如 ， 在 视频 播放 时 ， 大 多 数 计 算 机 的 图 形 显示 器 必须 每 33ms 刷新 一 次 。 保 持 世 界 记录 的 打字 员 
裔 键盘 交 速度 杞 只 能 是 大 约 每 SOms “次 击 键 。 磁 盘 通 常 需要 大约 10ms 来 局 动 一 次 磁盘 传送 .在 
客观 时 间 尺 度 上 ， 处 理 器 不 仔 地 在 许多 任务 之 则 切换 ， 一 次 分 配 绍 每 个 任务 大 约 5 一 20ms。 以 这 样 
的 速 庶 ， 用 户 感觉 上 任务 是 在 同时 进行 的 ， 国 为 人 不 能 够 察觉 短 于 大 约 100ms 的 时 间 段 。 在 这 段 时 
间 内 ， 处 理 莫 可 以 执行 几 百 万 条 指令 。 

图 9.1 在 对 数 凡 度 土 部 出 了 各 种 事件 类 型 的 持续 时 间 , 微 观 事 件 的 持续 时 间 以 ns ARRAK) 
ҖАЙ, ТЕН КЕКЕНЕ ms ARRORA EN OS 例 程 来 管理 的 ,而 村 大约 5 000-- 200 000 
АУР ЈА ДД. ЕКІН РД 来 测量 的 《〈 微 秒 ， 这 时 由 是 希腊 字符 “mua”)。 听 二 去 好 像 是 很 

多 的 计算 ， 但 是 它 比 处 理 【 大 ) 宏观 事件 要 快 很 多 ， 以 至 于 这 些 例 程 只 给 处 理 器 增 如 了 少量 的 负 


RARE (1 GHz 的 机 器 ) 








微观 的 ЖАШ 
一 一 一 一 人 一 一 
г m Sma: 磁盘 内 问 
/ pre m А RENE 
FP 除法 ' . rig 
= ЖИЕ i 
{ d |. 
1 ns 1 ns 1 ms 
1.E-09 1.E- 06 "Е-93 1200 
时 间 (seconds? 
图 9.1 计算 机 和 票 统 事件 的 时 间 尺 度 
处 理 器 硬件 在 的 秽 时 疝 尺 二 上 上 工作， 在 这 含 级别 二 事件 的 持续 时 间 部 是 几 ns Eny. OS ЖШ ЖИЫН FEES RE КЕЕН 
[i] Xj JL ms 最 级 上 的 事件 。 
练习 县 9.1 


当 用 户 用 EMACS 这 样 的 实时 编辑 器 来 编辑 文件 时 ， 每 次 击 键 部 产生 一 个 中 电信 号 。 然 后 ， 操 
作 系 统 必 须 调度 编辑 器 进程 ， 对 这 次 击 键 采 取 适 当 的 行动 。 概 设 我 们 有 一 个 时 钟 为 | GHz 的 系统 ， 
而 我 们 有 ТОО AF P ERI EMACS., 地 们 以 每 分 钟 100 个 单词 的 速度 输入 ,假设 每 个 单词 平均 有 6 
Же, АЛАН ВЕН OS 例 程 平均 需要 100 000 个 时 钟 周 期 / 键 ， 对 所 有 这 些 击 键 的 处 理 占 用 
ТЕП 365 82 $5 


注意 ， 这 是 对 键盘 使 用 造成 的 和 抽 载 非常 翡 观 的 分 析 。 很 难 想像 现实 生活 中 有 这 么 多 输入 如 此 快 
ҚАР, 
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562 $93 


9.1.1 进程 调度 和 计时 器 中 了断 

外 雍 溃 特 ， 例 如 而 键 、 磁 盘 燥 作 和 网 络 泊 动 ， 会 产生 中 断 信 号 ， 这 些 中 断 信号 使 得 摸 作 系统 调 
度 程序 得 以 运行 ， 可 能 还 会 切换 公吨 一 个 进程 。 基 使 没有 这 样 的 事件 ， 我 们 也 希望 处 理 器 从 一 个 进 
程 切 换 到 胃 一 个 ， 这 样 用 户 看 上 去 就 好 像 处 理 器 在 间 时 执行 许多 程序 一 样 。 出 于 这 个 原因 ， 计 算 机 
有 个 外 部 计时 器 ， 它 周期 性 地 向 处 理 器 发 送 中 断 信号。 这 些 中 断 信号 之 间 的 时 间 被 称 为 间隔 时 间 
(interval time). "Avr Bas Р ER, BERRAET UAE Z HE SEHE IE BUT BIER. 
ЖАЛА ХАН. x [Bl Eso ДЕЕ, DLORUE REESE ETE НЕДЕ, He 
Ж К CC IET ЕИБ 3, 5 方面， 从 CAERS AAE Ju T ER ЖН 
ХА ЕЕ ИНК, ЖАМК 个 进程 准备 好 状态 ， 因 此 将 间隔 设置 得 太 短 会 导 禾 性 能 很 差 。 
根据 处 理 器 以 及 处 理 器 的 配置 情况 ， 典 列 的 计时 器 间 风 范围 是 1 ~ 10ms. 
旁 注 ， 计 算 机 性 能 的 伸缩 

将 Digital Equipment Corporation 的 VAX-11/780 计算 机 的 性 能 比喻 成 一 个 现 居 处理 器 ， 这 是 很 
有 意思 的 .。 这 种 机 器 是 在 1977 年 出 现 的 ， 每 台 售 价 大 约 是 200 000 美元 ， 它 成 为 第 一 种 被 广泛 合用 
的 运行 Unix 操作 系统 的 机 器 . 注意 , 这 种 机 器 上 的 计时 器 间隔 典型 地 被 设置 为 10ms, 即使 它 的 CPU 


ERRAR СРО ЊТ 100048, 虽然 微观 时 间 尺 度 灾 化 得 飞快 ， 但 是 宏观 时 浊 尺 度 并 没有 改变 太 
£. 


图 9.2 (а) 从 系统 的 角度 说 明了 在 计时 器 间隔 为 10ms 的 系统 上 -个 假设 的 150ms 的 操作 。 在 
这 段 时 间 为 有 映 个 活动 的 进程 ， A 和 B。 处 理 器 交 煌 地 执行 进程 A 的 ”部 分 ， 然后 内 执 行 B 的 一 部 
分 ， 恢 此 类 推 。 当 处 再 器 执行 这 些 进 程 时 ， 它 要 么 运行 存 用 户 模式 ， 执 行 应 用 程序 的 指令 ， 肥 么 运 
行 在 内 核 模式 ， 代 堆 程 序 执行 措 作 系统 稍 数 ， 例 如 处 理 缺 页 、 和 输入 或 者 输出 。 回 想 一下， 内 核 操作 
被 认为 是 每 个 普通 进 各 的 一 部 分 ， 而 不 是 “个 独立 的 进 种 。 每 次 有 外 部 事件 或 者 计时 器 中 断 时 ， 吉 
会 调用 操作 系统 调度 程序 。 在 图 中 ， 计 时 器 中 断 的 发 生 是 由 短线 标记 来 表示 的 。 这 意味 着 在 每 个 电 
线 标 吕 处 部 有 一 些 内 核 活动 ， 但 是 为 了 简 使 ， 在 图 中 我 们 没有 显示 。 

са» STR HE Г] 

СА | в T A TBI А) 


(б) МАШИН 


809.2. 系统 和 应 用 对 时 间 的 看 法 
系统 从 “个 进程 切换 到 四 “个 进程 ， 这 些 进程 运行 在 用 疡 模式 或 者 内 核 模式 ， 当 应 用 的 进程 在 用 户 模式 中 执行 时 ， 应 用 才能 
完成 有 岂 的 计算 ， 

"HEFT А 切换 到 进程 B 时 ， 它 必 纺 进入 内 核 模 式 保存 进程 A 的 状态 〈 仿 被 认为 是 
进程 A 的 一 部 分 )， 然 后 恢复 过 程 B 的 状态 (被 认为 是 进程 B 的 -部 分 }。 因此， 在 每 次 从 一 个 进 
三 过 渡 到 男 个 进程 期 间 ， 是 有 内 核 活动 的 ， 在 其 他 时 候 ， 也 有 除了 切换 进程 之 外 的 内 访 活 动 ， 斧 
好 当道 过 使 用 -个 已经 在 存储 器 (memory) 中 的 页 来 满足 缺 贡 时 。 
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9.1.2 ”从 应 用 程序 的 角度 看 时 间 

从 应 用 程序 的 角度 出 发 , 可 以 把 时 间 流 看 成 两 种 时 间 段 的 交替 , БЕНЕН ЕН СҰ 
执行 它 的 指令 》， 另 一 种 时 间 段 里 程序 是 不 活动 的 《等 待 被 操作 系统 调度 1)。 当 应 用 的 进程 运行 在 有 有 
户 模式 中 时 ， 应 用 才能 执行 有 用 的 计算 。 图 9.2 (b) 说 明了 程序 A Jin fap SERE FR LER ЖЖ 
区 域内 应 用 是 活动 的 ， 此 时 进程 A 正在 用 户 模式 中 执行 ， 和 否则 它 是 不 活 丰 前。 

作为 一 种 量 水 在 活动 和 不 活动 时 间 段 之 间 交 痊 的 方法 ， 我 们 写 了 一 个 程序 “， 它 不 断 地 监视 它 
自己 ,确定 慎 么 时 候 有 长 的 不 活动 时 间 。 然 后 它 产生 一 个 «ке {跟踪 文件 )， 显 示 出 在 活动 和 不 活 
动 时 间 段 之 间 的 交 声 ， 本 章 后 面 会 描述 这 个 程序 的 细节 。 图 9.3 展示 了 一 个 这 样 的 trace 示例 ， 是 在 
一 个 时 钟 周期 大 约 为 550 MHz 的 Linux 机 器 上 运行 时 产生 的 。 每 个 时 间 段 都 标记 为 活动 的 〔 
战 者 不 活动 的 “17)。 时 间 段 被 编号 为 和 -9， 朋 来 标识 ， 对 于 每 个 时 间 段 ， 包 出 了 开始 时 间 《 要 对 
T trace 的 开始 ) 和 持续 时 长 。 以 时 钟 周期 和 ms 来 表示 时 间 。 这 个 trace 一 共 显示 了 2 个 时 间 段 (10 
个 活动 的 ，10 个 不 活动 的 )， 总 共 的 持续 时 间 是 669 ms。 在 这 个 例子 中 ， 不 活动 时 间 段 相当 短 ， 最 
К 0.50 ms。 和 大 名 数 不 活动 时 间 段 是 由 计时 器 中 有 断 造 成 的 。 被 监视 的 总 时 间 中 ， 太 约 95.1 96 2189] 
间 这 个 进程 都 是 活动 的 。 图 9.4 展示 了 图 9.3 所 示 的 trace 的 图 形 化 表示 。 注 意 ， 灰 色 三 角形 指明 了 
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їй SUR [В] ERR] 0 TEE UM RIS. АЛЕ ННІ ЕТЕ ВИ]. 


A0 BH 0 — (0.00 ms), ЯЯЫЙ 3726508 (6.776448 тз) 
їй #8 3726508 16,78 ms), 持续 时 间 275025 (0.500118 ms) 
Al ЖШ 4001533 (7.28 ms), AER SI 0 (0.000000 ms) 
Il ЫҢ 4001533 (7.28 ms), 持续 时 间 7598 (0.013817 ms) 
A2 #f 4009131 (7.29 ms), AME 5159247 (9.436358 ms) 
I2 时 间 9198373 (16,73 ms), 持续 时 间 251609 (0.457537 ms) 
АЗ fH] 9449987 (17,18 ms), AMENS 2250102 (4.091686 ms) 
ІЗ Wi 11700089 121.28 ms), 持续 时 间 14116 (0.225669 ms) 
Ad ЖШ 11714205 (21,30 ms), AMA&NE) 2955974 (5.375275 ms) 
14 时 间 14670179 126.68 ms), 持续 时 间 248500 (0.451883 ms) 
A5 # Ө] 14918679 (27.13 ms), ЕРЕ) 5222302 (9.498358 ms) 
I5 时 间 20142021 (36.63 ms), 持续 时 间 247113 (0.449361 mg) 
AG ЖШ 20389134 (37.08 ms), KA 5224777 (9.500967 ms) 
IG Hj] 25613911 146,58 ms), 持续 时 间 254340 (0.162503 ms) 
А7 #7] 25868251 (47.04 ms), ЖЫН 2678102 (6.688425 ma) 
17 Қ) 29546353 (53.73 ms), 持续 时 间 8139 (0.014800 тв) 
AB BH) 29554492 {53,74 ms), AMNES 1521187 (2.784379 ms) 
IB 时 间 31085679 {56.53 ms), 持续 时 间 248362 (0.451629 па) 
A9 BH] 31334039 (56.98 ms], AA MB 5223581 (9.498792 ms) 
19 Ж] 36557620 (66.48 ms), 持续 时 间 247295 (0.449874 ma) 


图 %.3 显示 活动 时 间 段 的 示例 race 


从 应 用 程序 的 角 你 来 看 ， 处 理 器 操作 是 在 程序 活动 执行 【以 斜体 表示 的 ) 和 不 活动 之 间 交 赫 进行 的 。 这 个 trace 展示 了 一 个 程 
ДЕЕ 66.9 ms 时 间 段 内 丙种 时 间 段 的 日 志 记 录 。 有 ЕЛДЕГІ ЕТІ 


图 9.5 展示 了 一 个 trace 的 一 部 分 ， 此 时 还 有 另 一 个 活动 进程 在 共享 处 理 器 。 图 9.6 中 展示 了 这 


2 BWPXHSMBEREE HE 
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个 trace 的 图 形 化 表示 。 注 意 ， 两 幅 图 中 的 有 时间 尺 樟 不 样 ， 因 为 我 们 显示 的 这 部 分 trace 基 从 跟踪 
进程 的 349.40 ms 外 开始 的 。 信 这 个 例子 中 ， 我 们 可 以 看 到 ， 在 处 理 茶 些 计 寺 器 中 断 时 ，OS 也 公决 
定 从 一 个 进程 切换 上 下 广 到 另 一 个 进程 。 央 此 ， 每 个 进程 只 会 在 大 约 SOIRS ESI. 


ЖӘНЕ, ӘЖ = 1 


|| [sm 
Ban 





н] (ms) 
图 9?.4 9.3 A trace 的 图 形 化 表示 


计时 器 中 断 基 由 灰色 三 角形 来 指 水 的 。 


AJ8 E 191514104 (349,40 ms), ЯАР) 5224961 (9.532449 ms) 
148 时间 136739065 (358,33 па), 持续 时 间 247557 (0.151644 ms) 
А49 AE 1965996622 (359.38 ms), ЯЯЫН 858571 [1.566382 та) 
T49 ”时 间 197845193 (360.85 ma), 持续 时 间 8297 {0.015137 те) 
ASQ — EHE 1927853490 (360.97 ms), Ms] 4357437 (7.949733 ms) 
I50 Ж 222210927 (368.91 не), ЖЯЯҒАЙ) 57.8758 :10.431335 ms) 
A5] у B 207929685 (379.35 ms), ФЕРЕР] 2047118 (3.734774 ms) 
151 ”时 间 219976803 (383.08 ms), 持续 时 间 7153 (0.013050 ms} 
A52 ЖИ) — 209983956 (383.10 ms), ФЕРЕ 3170650 (5.784552 та) 
152 Ж 213154606 [388.88 ms), ЖЗШ 5726129 110.446783 ms) 
A53 #8] 218880725 (399.33 ms), ABE 5217543 (9.518916 ms) 
153 ”时 间 224098278 (408.85 ms), 持续 时 间 5718135 110.432199 ms) 
А4 — HH 229816413 (419,28 ms), ФЕРЕР) 2359281 (4.304286 ms) 
I54 ”时 间 232175694 (423.58 ms), 持续 时 间 2096 — (0.012946 ms) 
A55 ЖШ 232182790 (423.60 ms), ЖАФАР] 2859227 15.216390 та) 
155 Жі 235042017 (428.81 ms), ЖА] 5718793 110,.433399 ma) 


当 还 有 其 他 活动 进程 在 在 时 ， 跟 路 进程 会 较 民 时 间 不 活动 。 这 个 trace 展示 了 


95 显示 有 负载 机 器 上 的 活动 时 间 段 的 示例 race 


ЖЕТЕ 53.0% [8] A ҖЕ ЕТЕ А. 


%5 9.2 


ARP m 9а ИЕМІН REA R H А. 


这 个 问题 是 甘于 图 9.5 所 示 trace 的 一 部 分 的 解释 的 ， 

A. 在 这 部 分 trace 中 ,什么 时 候 发 生 了 计时 器 中 断 ? (其 中 有 些 时 间 点 能 够 直接 从 trace 中 提取 
出 来 ， 和 而 有 些 必须 用 插值 法 估计.】 

B. 这 些 计时 履 中 扬中， 哪些 是 在 跟 基 进程 活动 时 发 生 的 ,哪些 是 在 它 不 活动 时 发 生 的 ? 

C. 为 什么 阳 长 的 不 活动 时 间 段 比 最 长 的 活动 时 间 段 要 长 泥 ? 


ТЕ ЗАТ fn] 565 


D. 根据 这 个 trace P $ 3) 39 5 ВАКА, ИДЕ Ж КТА И, УНА Т 
不 活动 状态 的 时 间 百 分 比 会 是 多 少 ? 


活动 时 间 段 .负载 = 2 
| 活动 的 
| Јав 
0 10 20 30 40 50 50 70 80 
tHE (ms) 


图 ?6 9.5% пасе 的 活动 时 间 段 的 图 形 化 表示 
计时 器 中 断 是 由 灰色 一 前 形 来 指示 的 ， 


9.2 通过 回 隔 计数 (interval counting) 来 测量 时 间 


操作 系统 也 用 计时 器 《trimer) 来 记录 每 个 进程 使 用 的 累计 时 间 ， 这 种 信息 提供 的 是 对 程序 执行 
时 间 不 孝 么 准确 的 测量 值 。 图 97 WEE ТИШ 92 中 所 示 的 系统 操作 示例 进行 这 种 记 账 
(accounting) Ч EHHH. FRE RHE P, 我 们 称 只 有 一 个 进 得 在 执行 的 一 段 村 间 为 时 间 医 (time 
segment) ^. 
ca) [RIS ET TH 


H TÜu + 305 
Һі А Ац Ав В. НЕ Bu B. Би Bu Ас Ап Аз Ац Bj Ап Бя mu B, Ra hu Аң Ап Аз As 


Өр 实际 时 间 


А [ A I A | A 80:335 
Р 79305 2335 


97 通过 同 隔 计 数 (interval counting). 来 对 进程 计时 

ҮЛ ӨП 2) 10ms 14, 8 10тв HARR SAG THE EACHARNA о) 或 者 系统 时 间 GO 的 -部 分 。 这 样 的 记 
Ж (accounting? ИН K REP BUT READ] - ШЕ 5, 
921 操作 

ВЕТЕРНА ЕИ {ЕИ ИА PST Bj ЖӨНІНЕН, ИЖЕ УЕ. HE 
ЖАЮ ЕН ERE AE. НУЖЕН T ИМАНЫН Ж ШӨН. B ЖЕ 
在 内 核 模 式 中 执行 的 ， 那 么 就 增加 系统 时 间 ， 否 则 就 增加 用 户 时 间 。 图 9.7 (а) 所 上 的 例子 表明 了 
对 两 个 进程 的 这 种 记 账 《accounting)。 短 线 标记 表明 发 生 了 计时 器 中 断 。 每 个 计时 器 中 断 都 出 被 增 
JUR SHEER IR: mW GERA 的 用 户 或 系统 时 间 Au dL As, BOX ENDE B 的 用 户 或 系统 时 间 


3 通常 称 为 时 间 片 。 一 一 译 者 
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Bu 或 Bs。 每 个 短线 标记 是 根据 紧 拱 着 它 的 左边 的 活动 来 标识 的 。 最 后 的 记 账 表明 进程 A 总 共 使 用 
( l50ms: 110ms 的 用 户 时 间 和 40ms МӨДЕ; ЖИВ 总 共 使 用 上 100ms: 70ms HA A i EA 
30ms ІН ЖТТ [В]. 


9.2.2 ” 读 进程 的 计时 器 

=A Unix shell 执行 一 个 命令 时 , 用 户 可 以 在 命令 前 加 上 单词 “time”， 来 浏 量 命 令 的 执行 时 间 。 
这 个 傅 令 使 用 的 值 是 用 上 上 面 描述 的 记 账 方法 计算 出 来 的 。 例 如 ， 为 了 计算 命令 行 参数 为 -n 17 的 程 
ГЕ prog 的 执行 时 间 ， 用 户 只 要 简单 地 输入 命令 ; 

іпіх>» time prog -n 17 

ТЕ PEPERIT et E, shell ITE IS ЕТЕН ARI M41. ЖЕ МН МАҒ: 

2.22100 Ü.2608 0:06.52 28.1% 0+0к Ü+0io В0рЕ +0 

这 CEDE PACEM BIET ЕШ Л ЖЖП ЫЛЕ. АА ТЕМЫ 
SS. dO. ЫН А 10 ms, MARTHE ЯЛ WARR. 8 т ДЕ 
xp], АЯНЫ GA Won. 我 们 注意 到 系统 和 用 户 时 间 加 起 染 是 2.49s， 比 总 共 经 过 的 时 间 
6.52« 的 一 半 还 要 少 ， 这 表明 处 理 器 同时 还 在 执行 其 他 的 进程 。 НЛІ ЕН F RIS SER] т 
过 时 间 的 比例 ， 枫 如 ，(2.23 + 0.26у/6.52 = 0.381。 剩 下 的 统计 数据 总 结 了 页 面 调度 和 TO 行为 。 

ЕҢЕЛ Vet LOBOS PE ES 38 times 来 读 进 程 的 计时 器 ， 这 个 函数 的 声明 如 下， 


include «sys/times.h» 


struct tms ! 


clock t tms utime; /* user time %/ 
Ciock t tms stime; /* system time */ 


ciock t tma cutime; /* user time of reaped children */ 
сізек L tms cstime; /* system time of reaped chiidren */ 
ү: 
clock t timesístruc- tms *buf!; 





返回 : 自 系 统 . 局 动 以 来 经 过 的 时 钟 渍 答 教 ， 

这 些 | 时 则 测量 值 是 以 时 钟 滴答 tclock tick》 为 单位 来 表示 的 。 定 义 的 常数 СІК ТСК 指骨 每 秒 
的 时 钟 满 答 数 。 数 据 芝 型 clock_t 通常 定义 为 长 整 型 , 指明 子 时 间 的 字段 给 出 的 是 己 经 终止 了 并 且 被 
anl f Bx REPRISE). МІН, times 不 能 用 来 监视 任何 正在 进行 的 了 进程 所 使 用 药 时 间 。 
作为 返 四 值 , times 返 岂 的 是 从 系统 启动 开始 已 经 经 过 的 革 钟 滴答 总 数 。 因 此 我 们 可 以 通过 两 次 旋 用 
imes， 册 计算 纳 个 返回 值 的 着， 来 计算 :个 程序 执行 中 间 个 不 同 点 之 间 的 总 时 间 《 以 时 钟 滴答 为 单 
位 )， 

ANSI C 标 谁 还 定义 了 一 个 clock 图 数 ， 它 测量 当前 进程 使 用 的 总 时 间 |; 


Жілсішіе etime, ћ> 


Clock t clockiveid}; 





返回 :进程 使 用 的 总 时 间 ， 


测量 程序 执行 时 间 567 


B Mv RS [3] 48 ТВ З imes 使 用 的 一 样 ， 都 声明 为 clock іл, {НЕ Л КАТ АЖ ОЛЫ 
问 的 单位 是 不 -- 样 的 。 ЖЖ clock 图 数 报告 的 时 间 变 成 秒 数 ， 必 须 把 它 除 以 定义 好 的 常数 CLOCKS 
PER_SEC。 这 个 常数 值 不 一 定 要 和 党 数 CLK_TCK 相同 。 


9.23 ”进程 计时 器 的 准确 性 

如 图 9 了 所 小 的 示例 ， 这 个 计时 机 制 只 是 近似 的 。 图 97 (b) 展示 了 两 个 进程 实际 使 用 的 时 间 。 
进程 总 共 执 行 了 153.3ms， 其 中 用 户 模式 120.0 ms, 内 核 模式 33.3ms。 进程 B НИТ 7 96.7005, 
其 中 用 户 模 式 73.3ms， 内 核 模式 23.3ms。 采 用 间隔 计数 的 记 账 《interval accounting). 方法 并 不 会 比 
计时 器 间隔 【timer interval) 方法 更 好 地 解决 时 间 问 题 。 


练习 题 9.3 
操作 系统 会 怎 幸 报告 下 面 所 示 执 行 序列 的 用 户 和 系统 时 间 ? 假设 计时 器 间隔 为 10 ms. 


Al 8 | AJ B j| A 1 


练习 题 9.4 

在 一 个 计时 器 间 陋 为 10 ms АЯ Е, ЖНА 的 茶 一 个 时 间 段 被 记录 为 需要 70 ms， 包括 系统 
各 用户 时 间 。 这 个 片段 使 用 的 最 太 和 最 小 实际 时 间 是 多 少 ? 

ЖЫШ 9.5 

对 于 图 93 中 所 示 的 trace, НІН (counter) 记录 的 系统 和 用 户 时 间 会 是 多 少 ? 这 个 时 间 
与 讲 程 处 于 活动 状态 的 实际 时 间 之 比 为 多 少 ? 

对 于 运行 时 邮 是 够 长 的 程序 Cro SE Пр), 这 种 方法 中 的 不 准确 性 就 能 相互 弥补 了 。-- 些 冉 
ls] Ez PP] НЕЕ To. mm ЕН T. ЖЕҢЕШЕ -平均 ， 期 望 的 误差 就 接近 于 0 Г. 
小 过 ， 从 理论 的 角度 来 看 ， 对 于 这 种 测量 值 与 真实 运行 时 间 的 差距 有 多 人 ， 并 没有 确切 的 界限 。 

为 了 测试 这 种 计时 方法 的 谁 确 性 ， 我 们 运行 了 一 系 划 实验， 比较 相同 样本 计算 下 操作 系统 所 测 
ЖҮН T 和 如 果 系 统 资源 只 用 来 执行 这 个 计算 时 我 们 估计 的 时 间 T. -mE T. 与 TS 不 相间 有 
H LARA: 

ҺАУ ОТА SU BJ APTE RR E n] А PW Т, W. T. hak K. 

2， 计 时 器 中 断 导致 的 内 核 活动 占用 了 总 CPU 周期 的 4 够 一 5 名， 但 是 对 这 些 周期 的 计数 不 是 很 
适当 。 正 如 从 图 9.4 所 示 的 trace 中 可 以 看 到 的 都 样 ， 这 个 活动 在 下 一 次 计时 器 中 断 之 前 结束 ， 因 此 
没有 显 式 业 佑 算 进 去 。 相 反 ， 它 只 简单 地 减少 了 下 一 个 时 间 间 隔 内 执行 进程 的 可 用 周期 数 。 相 对 于 
Т,, ZAIT Ta- 

3， 汉 处 理 器 从 一 个 任务 切换 到 另 一 个 任务 时 ， 在 一 个 短暂 的 时 间 内 ， 高 速 缓 存 可 能 会 执行 效率 
很 关 ， 和 直到 新 任务 的 指令 和 数据 被 加 载 天 高 速 缓存 中 .因此 ， 当 椒 理 器 在 我 们 的 程序 与 其 他 活动 之 
间 切 换 时 ， 它 的 执行 效率 没有 连续 执行 我 人 程序 时 的 效率 高 。 相 对 于 Т, BARE AM Tha 

在 机 章 后 面 ， 我 们 将 讨论 如 何 确定 我 们 下 例 计 算 的 工 . 值 。 

& 9.8 给 出 了 在 两 种 不 同 的 负载 条 件 下 运行 这 个 试验 的 结果 。 这 些 曲 线 图 展示 了 我 们 的 误差 率 
的 测量 值 , 它 定义 为 全. 的 一 个 函数 (YT, - ТУТ, ЖИН. АТ, АНЕ ТН, 这 个 误差 测量 信 为 仙 ， 
AT few RT T. 时 ， 它 为 正 。 两 组 数据 显示 的 是 在 两 种 木 同 负载 条 人 忻 下 测量 的 值 。 标 号 为 “ 负 
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组 数据 显示 的 是 另外 还 有 10 个 进程 也 在 试图 进行 同 拌 的 计算 时 的 情况 .后 者 代表 的 县 一 个 负载 非 党 
重 的 情况 ， 系 统 对 市 键 和 其 他 服务 请 求 的 响应 明显 慢 了 。， НА, ХЕНТЕ АРА АНА ІН А. 
一 般 而 过 ， 上 只 有 在 真实 倩 土 10 鸡 范围 内 的 测 昌 值 才 是 可 接受 的 ， 因 此 我 们 兵 希 望 误差 变化 范围 为 人 
约 -0.] 一 40.1。 
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预期 的 CPU 时 间 ims) 
7.8 测量 间隔 计数 kirierval counting). 的 准确 性 

当 测 最 活动 乱 十 大约 100 ms (0 个 计 叶 器 间隔 》 时 ， 误 差 会 不 可 其 受 得 再。 此外， 无 沦 是 过 行 在 前 载 ГИН AiE D 的 机 
5), БАНАН EMIA Г СОҢЫ» RARER ANM EFI. 

fT KJ 100ms CIO ИЕ ЖЕН 0, ҒИ, SURGENS. ІН КЕНТІ 
EDGE ЖЕНИ $E—— 100 000 000 ^ FEET КИН НН 5---ЯҢ. БКТ», RIMA Ж ИА ЖЫН s 11: 
0.0--01 2 19], ERE, fg 10% ЕИЯЖ. WEAN АҒЫЛ, 2 TATAK. 0 Y SE 
ТЕМ, AHF: 对 于 所 有 T,2 00 ms МЕҢ, Р у 1.04, SX EDDA i HE SRI Y 
H] Y AS 490] CPU 时 间 。 

ix Hosp iio ЖЕЛИ ЕИ AS ROG RIEF TE REEDE HHB A ЯН. ЕП ЖОН, AREH ЗН 
间 小 于 100ms HWE. 在 这 全 机 器 L, ХИТИН ЖАН, xi mp ss EIN TR]. EXER 
约 4 铝 。 这 种 计时 和 机制 的 主 槛 优点 是 它 的 准 位 性 不 是 非常 依赖 于 系统 负载 ， 


93 11% 
为 了 给 计时 测量 提供 更 高 的 精确 度 ， 许 多 处 理 器 还 包含 一 个 运行 在 时 钟 周期 级 的 计时 器 。 这 个 
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计时 器 是 一 个 特殊 的 寄存 器 ， 每 个 时 钟 周 期 它 都 会 加 1。 可 以 用 特殊 的 机 器 指令 来 读 这 个 六 数 器 的 
ІН. 不 是 所 有 的 人 处 理 器 部 有 这 样 的 计数 器 的 , 而 且 有 这 样 计数 器 的 处 理 器 在 实现 细节 上 也 各 不 相同 。 
因此 ,程序 员 无 法 用 统 -的 、 与 平台 无关 的 接 只 使 用 这 些 计数 器 。 另 - 方面 ， 只 用 少量 的 汇编 代码 ， 
通 滑 很 深 易 就 为 茶 个 特定 的 机 器 创建 -个 程序 接口 。 


9.3.1 1A32 周期 计数 器 

Г Ai, 我 们 已 经 报告 的 希 有 计时 和 值 部 是 用 1A32 周期 计数 器 (cycle counter? 测 最 出 来 的 。 
在 1A32 体系 结构 中 ， 周 期 计数 器 是 与 “P6” 微 体系 结构 (PentiumPro A Ks Sh) EEH ЖЕ 
的 。 周 期 计数 路 是 个 64 位 无 符号 数 。 对 于 一 -个 运行 时 钟 为 1 GHz 的 处 理 器 ， 只 有 在 每 1.8 X10" 
, 或 者 每 570 年 ， 这 个 计数 器 才 会 从 2 - | 绕 回 到 0。 另 一 方面 ， 如 果 我 们 只 考虑 这 个 计数 器 的 
低 32 位 ， 把 它 看 成 一 个 无 符号 整数 ， 那 么 这 个 值 会 大 约 每 4.3 БҰЗВЫЖ. 因此， 我 们 就 明 折 了 为 
14. 1A32 的 没 计 者 会 决定 实现 一 个 64 МІН Ж. 

[A32 VERSUS R: PH rdtsc Cread time stamp counter, ТЕН] ЖЖ) 指令 来 访问 的 。 这 条 指令 总 
ЖЖ. БНТ едх 设置 为 计数 器 的 看 32 位， 而 寄存 器 3eax Кш АИ 3246. АЯТЕ Т 
CHFO., X AERTIBOBEB—T TY: 





void azcess counteriunsigned “Бі, unsigned *101; 


ТАМ ЖЯМЕН ERE IE RE 32 位 ， 将 lo 设置 成 低 32 у. TERI 3.15 节 中 描述 的 
GCC IE BEA SE, SETA access counter ШЕВ, (dang 9.9 His, 


code/perficiock.c 
1 Р Initialize the cycle counter */ 
2 static unsigned cyc_hi = 0; 
3 static unsigned сұс lo = Q; 
4 
5 
Š ж Set *hi and *lo to the high and low order bits of the cycle counter. 
7 Implementation requires assembly code to use the rdtsc instruction. */ 
R void access counte-[unsigned *hi, unsigned *15) 
3 i 
10 agm("rdtsc; movl *%ecx,%0; movl &95ax,*1" /# Read cycle counter */ 
11 ; "cp" d*hij, "zy" ¿(*1o; /* and move results to */ 
12 : /* No input */ /* the two outputs */ 
13 D "едх", "%еах"); 
14 ) 
15 
16 /* Record the current value of the cycle counter. */ 
17 vold start counLer(í) 
18 | 
19 access counter(&cyc hi, &cyc lo); 
20 } 


л Һ 
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2 + Return the number of cycles since the last call ta start. counter. */ 
23 dou»xle get counterí) 

да { 

25 unsigned ncyc hi, ncyculo; 

2 É. unsigned hi, lo, borrow; 

27 double result; 

ав 

2t {* Get cycle counter */ 

30 access caounteríkncyc hi, &ncyc loj; 

31 

32 /* Do double precision subtraction */ 

ii lo = пус lo - сус 1o; 

i£ borrow = lo > mey lo; 

35 hi - ncyc hl - cyc hi - borrow; 

35 result = (double) hi * (1 =< 30) * 4 + lo; 
37 ІЁ (result < 9) í 

28 ferintf (stderr, "Error: counter returns neg value: €.0:*n", result); 
38 h 

40 reLurn result; 

47 } 


coderperffclack.c 


9.9 实现 IA32 周期 计数 器 的 程序 接口 的 代码 
ЖЕПП Ж НИЕ КИЧЕ. 


ЛТХ ТЕ, ФАНЕР НЫН АЖ, ARRERA ТЕКИ ТТЕП Н] 3 2 [8] Ж КН 


tinclade "clack.h" 
vid tart councer!); 


dcuble get. counzer!]: 





жн; 自 最 后 一 次 调用 局 动 计数 路 所 经 过 的 周期 数 . 


我 们 退回 的 时 间 是 double 类 型 的 ， 以 避免 只 使 用 32 位 整数 串 能 引起 的 谎 出 问题 。 这 疝 个 例 各 
的 代码 也 显 术 在 图 9.9 中。 它 是 建立 在 我 们 对 执行 双 精 度 减 法 和 将 结果 转换 成 double ЖАЛАНЫ 
运 针 的 型 解 的 基础 上 的 。 


9.4 ”用 周期 计数 器 来 测量 程序 执行 时 间 


周期 计数 万 (cycle counter) 提供 了 一 个 非常 精确 的 工具 ， 可 以 测量 -个 程序 执行 中 两 个 相同 点 
之 加 经 过 的 时 间 。 不 过 ， 典 型 地 ， 我 们 对 测量 执行 某 段 特 殊 代 码 所 需要 的 时 间 感 兴趣 ， 我 们 的 周期 
ИЖЕ НІНІ start, counter 和 调用 get. counter 之 间 总 的 周期 数 。 这 些 秽 程 不 记录 嘟 个 进程 使 
用 这 些 周期 或 者 处 砷 器 是 在 内 核 还 是 在 用 户 模式 中 运行 的 。 在 使 用 这 样 的 测量 设备 来 确定 执行 时 
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НІН, ИЕ Л». BAL ЕАО ЯЕ AB. ЕИ i 11. 

作为 一 个 使 用 周期 计数 器 的 代码 示例 ， 图 9.10 PRAET - ИЯ МИЛ 
法 。 在 儿 个 系统 上 ， 以 参数 sleeptime 等 于 1 来 测量 这 个 函数 ,测量 值 表 明 它 报告 的 时 知 频率 企 说 处 
理 器 评测 性 能 的 1.0% 范 围 之 内 。 这 个 示例 清楚 地 表明 我 们 的 便 程 测量 的 是 经 过 的 时 间 ， 耐 不 是 茶 个 
进程 使 用 的 时 间 。 当 我 们 的 程序 调用 steep М, МЕ ОА ИН, AA 1s 的 睡眠 时 间 到 
达 。 这 期 间 经 过 的 周期 是 被 其 他 进程 执行 的 。 


code/perf/clock.c 
1 № Estimate the clock rate by measuring the cycles that elapse */ 
à /* while sleeping for sleeptime seconds */ 
3 double mhz;int verbose, int sleeptime! 
4 
5 double rate; 
5 
7 start counter); 
B sleepi(sleeptime); 
9 rate = geb counter() / (le6*sleeptime]; 
10 LË (verbose) 
11 printfí('Processor clock rate ~= %.1Ё МНт\п", rate]; 
12 return rate; 
13 ) 
code/perf/clock.c 


图 9.10. gif mhz: 确定 一 个 处 理 器 的 时 钟 频率 


9.4.1 上 下 文 切 换 的 影响 
测量 某 个 过 程 P 的 运行 时 间 的 一 种 简单 方法 就 是 用 周期 计数 器 来 对 了 的 一 次 执行 进行 计时 ， 就 
像 在 下 列 代 妈 中 一 样 ， 
1 double time, Р() 
2 í 
3 start counter(í): 
4 P (1; 
5 return get, counter); 
5 


} 

如 采 企 两 次 调用 计数 器 例 程 之 间 ， 有 另外 基 个 进程 执行 了 ， 那 么 这 段 代码 就 很 容易 产生 令 人 误 
ЖЕ Ж. ШАА ЫШ. ЖИИ P 的 运行 时 间 特 别 长 ， 这 就 特别 成 问题 。 图 9.11 说 明了 这 
一 现象 。 其 中 展示 了 反复 测量 一 个 程序 前 结果 ,这 个 程序 计算 的 是 一 个 131 072 个 整数 的 数组 的 和 。 
I CREER, 7 БА ms 为 单位 。 注 意 总 的 送行 时 间 是 36 ms， 比 计时 器 间 隐 值 大 "。 我 们 进行 两 组 测 
量 ， 每 组 对 问 一 个 过 程 测量 18 次 。 标 号 为 “负载 1” 的 那 组 数据 说 明 的 是 在 负载 很 轻 的 机 器 上 的 运 
行 时 间 ， 此 时 机 器 上 只 有 -个 进程 在 运行 。 所 有 的 测量 值 都 在 最 小 运行 时 间 的 3:496 HI B. КУ 


4 操作 系统 根据 计时 器 间 隅 的 值 来 执行 进程 调度 。 一 一 译 者 
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2] “ fh 3 4” ЛЕ CECI RUE Е НЕВЕ CPU ЖИЕ Ж SHEER ERE AE TT IH D) as 
行 时 间 。 关 七 个 样本 的 时 间 在 负载 1 样本 中 最 快 的 时 间 的 2% 范 围 之 内 , 但 是 其 他 的 时 间 比 43 (52 
T. 
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样本 


ЕЎ 在 不 同 的 负载 情况 下 ， 对 长 持续 时 间 的 过 程 的 测量 

TO 个 负载 很 轻 的 系统 上， 各 个 样本 的 结果 是 - XN. BEE— TERI EAT. EMRE A E P But Rt T 
fim I. 
9.42 TE GO (EA X E ПШ 

RERIT A x PD АЙЕ ЖЕКЕ P КХР E, FEY mM LE, I 9.12 展 
小 了 一 组 类 似 本 图 %.11 rn fgg e (n. pe S EC EDI 4 f, IEEE IE TE] ACA E Sms. XS, 
1ТЕ] [КИЛЫ ЖН ERU. [КАЙТАЛ Ka НЕР E 下文 切换 的 影响 。 我 们 看 到 济 量 信和 有 变化 ， 但 是 
ЕЛМЕНЕН ЕКОЕ АСТАР Е ЯА А. 

图 9,12 ВОХНАМЕКЕДН BEAR GEL Pf M PS h e D] Е 
ITH, ТАЕН АННО Н ЕТ. 

作为 -个 示例 ， 我 们 写 FS REF proca 和 procB， 输 入 为 一 个 类 型 为 double * 的 指针 ， 
开 且 将 从 这 个 指针 开始 的 8 个 连续 的 元 素 设置 为 0.0。 我 们 测量 以 个 不 同 的 指针 bl b2 和 b3 对 
这 个 过 程 进行 调用 的 时 钟 周期 数 。 训 用 序列 和 得 到 的 测量 值 如 图 9.13 所 未 。 凤 使 这 些 调 用 执行 的 是 
完全 春 问 的 计算 ， 计 时 的 变化 也 几乎 有 4 信 。 因 为 这 段 代码 中 没有 条 件 分 支 ， 所 以 我 们 可 以 断定 这 
E SE mug mE, 


5 MALAE time interval， 而 我 们 认为 是 mer interval. —— Ж 
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一 上 
= 


时 间 Kms? 
сз — no Kat +T Cn т -~+ с am 





样本 


4912 在 不 同 的 负载 情况 下 ， 对 短 持 续 时 间 的 过 程 的 测量 
ФЕН I 中 的 变化 那么 大 ， 介 是 还 是 大 得 不 可 接受 ， 


procAini) 
ргосА (32) 
рІосА,53) 
ргосА!(Һ1) 
procBibl? 





procBib2) 


4913 相同 的 过 程 在 相同 的 数据 集 上 的 测量 序列 
这 些 测量 俩 中 的 变化 主要 是 由 指令 和 数据 高 速 缓存 中 不 同 的 五 命 中 情况 造成 的 。 


练习 题 9.6 

表示 如 果 没 有 高 速 续 存 不 命中 ， 调 用 poca 或 者 procB ИНАК. ATARE, HT 
南 速 缓存 不 命中 浪费 的 周期 可 以 分 捧 到 每 个 需要 取出 来 放 到 高 速 雏 存 中 的 雪 据 上 : 

e 实现 测 醒 代码 的 指令 【例如 start counter. get, counter 等 等 )。 设 这 些 指令 所 需 膨 期 数 为 m. 

. XXGRXCEIDENMJE4 (proca 或 者 proch) ЖЕНАТ ЕД Э p. 

. АНЕ Е (由 bl，b2 或 b3 指示 )。 设 这 些 指 邻 所 需 周期 数 为 d。 

根据 图 9.13 Ff Fb] f da. Qh с. m. ped eir fh. 


HAS BT hik, AHB BPB ај. 0—1 ЧИЕ? "不幸 地 是 ， 对 这 个 问题 没 
有 简单 的 答案 。 这 取决 于 我 们 的 代码 实际 使 用 的 情况 ， 以 及 我 们 能 够 效 得 可 靠 测量 值 的 情况 。 一 个 
问题 是 测量 值 每 次 运行 部 不 相同 。 图 9.13 所 示 的 测量 表 显 示 的 只 是 -一次 测量 的 数据 .在 吧 复 的 测量 
中 ,我 们 看 到 测量 1 的 范围 为 217—606. 而 济 量 5 的 范围 为 301 一 326。 另 外 ， 其 他 四 次 测量 每 次 运 
行 的 变化 只 有 几 个 周期 。 

显然 ， 测 量 1 估计 过 高 ， 因 为 它 包 括 了 将 测量 代码 和 数据 结构 加 载 到 高 速 缓存 中 的 开销 。 进 一 
步 来 说 ， 它 的 变化 程度 最 容易 大 。 测 量 5 包括 了 将 procB 加 载 到 高 速 缓存 中 的 开销 。 它 的 变化 程度 
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也 容易 比较 大 。 在 大 多 数 实际 应 用 中 ， 问 样 的 代码 会 被 反复 执行 。 因 此 ， 将 代码 加 载 到 指令 高 速 组 
下 中 的 时 间 机 对 而 吝 不 太 重 要 。 我 们 的 示例 测量 有 点 人 为 的 痕迹 ， 央 为 指令 高 速 缓存 不 命中 的 影响 
比 实际 应 用 中 的 要 大 一 些 。 

为 了 测 电 过 程 P 所 需 的 时 间 ， 侍 过 程 P 中 指令 高 速 缓存 不 命中 的 影响 已经 减 小 到 最 低 了 ， 我 们 
可 以 执行 下 列 代码 ; 


1 double time, P warm) 

2 1 

3 Pi): /* Warm up the cache */ 
£ start counterí); 

5 P(]; 

6 return get counterit)l; 


} 


ТЕЗЕ ТАТАР. ЖРТ АЗАД А.З b ж ЕН. 

X& BEL CUS LB, Е А ER Par h ТУШЕ К л, AAA RAT. P 1838 P УПЫ 
AP BEST. XE ТМ procA 和 ргосВ, time P warm 的 测量 会 得 到 100 个 周期 。 如 果 我 
们 预想 代码 会 重复 也 访问 同样 的 数据 ， 屠 人 么 这 就 是 测量 的 正确 条 件 。 不 过 对 于 一 些 应用 ， 我 们 更 可 
能 征 每 次 执行 部 访问 新 的 数据 。 例 如 ， 一 个 过 程 妊 数据 从 存储 器 的 一 个 区 域 措 贝 到 另 一 个 区 域 ， 委 
ПЕН ОТ БЕЙНЕ. ЧО time P warm 倾向 于 低 佑 这样-… 个 程序 的 执行 时间 。 对 于 proca 或 
Ж procB , 它 会 得 到 100 个 周期 , 而 不 是 当 过 程 被 应 用 到 本 组 存 的 数据 上 时 测 出 的 132 一 134 个 周期 。 

为 了 使 计时 代码 测量 一 个 初始 时 没有 数据 被 缓存 了 的 过 程 ， 我 们 可 以 存 执行 实际 的 测量 之 前 ， 
清空 间 速 缓 在 中 所 有 有 用 的 数据 。 下 而 的 过程 就 是 为 一 个 尚 速 艘 存 大 小 不 大 十 512KB 的 系统 完成 这 
一 功能 的 ; 





code/perf/time p.c 
/* Number of bytes in the largest cache to be cleared */ 

define CBYTES (1««191 

*define CINTS iCBYTES/sizeof(int)) 


/* А large array to bring into cache */ 
static int dummy [CINTS] 
volatile int sink; 


С —] gn (лы ы b ҥе 


9 {* Evict the existing blocks from the data caches */ 
10 void clear, cache) 


11 í 

12 int 1 

13 int sum - 0; 

14 

15 for {i = дрі < CINTS; i++) 
16 Зитату [1] = 3; 


17 tor {i = O; i < CINTS; i++) 


测量 程序 执行 时 间 575 


18 aum += dummy iij; 
19 Sink = sum: 
20 } 


—— M codeperiime p.c 


这 个 过 程 只 是 在 一 个 非常 大 的 数组 dummy 上 执行 一 个 计算 ， 有 效 地 从 高 速 缓存 中 清除 出 所 有 
其 他 的 东西 ， 这 个 代码 有 几 个 特殊 的 性 质 ， 用 来 避免 常见 的 错误 。 它 将 信 看 储 到 dummy Б, ЖЕҢ 
把 它们 读 出 来 ， 这 样 无 论 高 速 缓存 分 配 策略 是 怎样 的 ， 都 会 缓存 这 个 数组 。 这 段 代 码 用 数组 的 值 执 
行 一 个 计算 ， 并 将 结果 存储 到 一 个 全 局 整数 中 《声明 为 volatile 就 表明 对 这 个 变量 的 任何 更 新 痢 必 
须 被 执行 )， 这 栏 熏 得 腾 明 的 优化 编译 器 不 会 优化 掉 这 部 分 代码 。 

使 用 这 个 过 程 ， 我 们 可 以 获得 在 P 的 指令 都 被 缓存 而 数据 没有 被 缓存 的 情况 下 P 的 一 个 浏 量 
ЇН: 

1 double time_P_cold{) 

2 i 

3 Pi); /* Warm up instruction cache */ 

4 clear сасһеі); /* Clear data cache */ 

5 start counterí]; 

5 РІ); 

return get counterí); 

В ] 

当然 ， 这 个 方法 也 有 缺点 。 在 一 个 有 统一 L2 高速 缓存 的 机 器 上 ， 过 程 clear cache 22 P 的 
所 有 指令 都 被 消除。 幸运 的 是 ，L1 指令 高 速 缓存 中 的 指令 还 会 保存 ， 过 程 clear cache 还 会 从 高 速 
缓存 中 清除 出 大 部 分 运行 时 栈 ， 导 禾 过 高 地 估计 了 在 更 加 真实 的 条 件 中 ВТ ЖЕН „ 

正如 这 里 的 讨论 说 明 的 郑 样 ， 高 速 缓存 的 影响 为 性 能 测量 增 坝 了 特殊 的 困难 。 程 序 员 几 平 不 能 
控制 什么 指令 和 数据 会 被 加载 到 高 速 缓存 中 ， 而 当 必 须 加 载 新 值 时 又 该 清除 什么 指令 和 数据 。 最 好 
的 情况 下 ， 我 们 能 够 设置 好 测量 条 件 ， 通 过 一 些 清空 和 加 载 高 速 缓存 的 组 合 ， 使 得 测量 条 忻 与 我 们 
应 用 期 望 的 条 件 相 匹 配 。 

正如 创面 提 到 过 的 ， 分 文 预 测 逻 辑 也 会 影 吗 程 序 性 能 ， 因 为 当 分 嘉 方 同和 目的 都 预测 正确 时 ， 
分 支 指 令 引 起 的 时 间 处 罚 要 小 得 多 。 这 个 逻辑 是 根据 已 经 执行 过 的 分 支 指令 的 历史 记录 来 进行 预测 
的 ， 当 系统 从 一 个 进程 切换 到 另 一 个 时 ， 开 始 时 新 进程 中 的 分 支 预 测 是 根据 前 一 个 进程 中 执行 的 分 
广 指 令 来 进行 的 。 不 过 ， 实 际 上 ， 这 些 影 响 对 程序 的 每 次 执行 只 会 造成 很 小 的 性 能 变化 。 预 测 主要 
依赖 于 最 近 的 分 文 ， 因 此 一 个 进程 对 另 一 个 进程 的 影响 非常 小 。 
943 KK 次 最 优 测量 方法 

虽然 我 们 使 用 周期 计时 器 测量 容易 受 由 上 下 文 切 澳 、 高 速 绿 存 操作 和 分 支 预测 引起 的 误差 的 影 
啊 ， 但 是 一 个 重要 的 特性 就 是 这 些 误 差 总 是 导致 过 高 地 估计 真实 的 执行 时 间 。 处 理 器 做 的 事情 都 不 
会 人 为 地 加 速 一 个 程序 的 执行 。 即 使 上 下 文 切换 和 其 他 影响 会 引起 测量 值 不 一 致 ， 我 们 仍然 可 以 利 
用 这 个 属性 来 狭 得 执行 时 间 可 靠 的 测量 值 。 

慨叹 我 们 重复 地 执行 一 个 过 程 ， 用 іше P warm 或 者 time P cold 来 测量 周期 数 。 我 们 记录 K 
(例如 30 次 最 快 的 时 间 。 如 果 我 们 发 现 这 种 测量 的 误差 e TEL Ch 0.1 旬 )， 那 么 用 测量 的 最 快 值 
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Kok a АЈА АУЕ ТЕК д ВРЗ АЈ. ЖА j nb), БАҒЫН 9.11 所 二 的 那些 次 测量 ， 我 们 
REREN 10%. WATR 1 RUIT ESTHER CRT OPE BLZ W, 而 负载 4 最 快 的 一 个 测量 
位 在 菩 个 况 产 范围 之 肉 。 因 此 我 们 可 以 得 出 结论 说 运行 时 间 分 剂 为 35.98 ms 和 35.89 ms， 对 于 负载 
4 的 情况 ， 我 们 还 可 以 看 到 测量 值 集中 在 125.3 ms 附近 ， 有 六 个 大 约 为 155.8 ms， 但 是 我 们 安全 地 
玉 痉 了 这 些 过 高 的 估计 值 。 

我 们 称 这 种 方法 为 “ 开 次 最 优 【K-Best) 方法 ”。 它 要 求 设置 二 个 参数 ， 

K:， 我 们 和 要求 在 某 个 接近 最 快 值 范围 内 的 市 量 值 效 量 ， 

е 这 些 测 量 必须 有 多 大 程度 的 接近 。 也 就 是 ， 如 果 测 量 值 按照 升序 标号 为 WwW va сб vus 
那么 我 们 要 求 (] кезу > vx. 

М: 在 我 们 中 止 之 前 ， 测 量 值 的 最 人 数量 。 

我 们 的 实 磺 进行 了 -系列 尝试 ， 并 旦 核 申 排 序 的 方式 维护 着 一 个 上 个 最 快 时 间 的 数组 。 对 十 每 
ИНЕМ, 它 会 检 合 这 个 值 是 否 比 当前 数组 位 图 六 中 的 信 更 快 。 n E, ЕСБАЙ К, 
然后 执行 一 系列 相 邹 数组 位 置 之 间 的 交换 ， 料 这 个 但 移 庆 数组 中 适当 的 位 置 。 雇 续 这 个 过 程 ， 自 到 
谋 着 标 诽 满 是 ， 此 时 我 们 称 测量 值 已 经 “ 收 全 了"， 或 者 我 们 超过 了 模 限 M， 此 时 我 们 称 测量 值 不 
REIN RE. 

试验 评价 

我 们 进行 了 系列 试验 来 测 景 KK HEC EET BESTE. F BL E ЖЕДИ] E ЖКН 
ЯЙ; 

|. 这 个 方法 产生 多 是 准确 的 测量 值 吗 ? 

2. fA BHO Ee CO, dr ERE? 

3. 这 个 方法 能 够 确定 它 白 己 的 测量 值 的 准确 性 吗 ? 

设计 这 样 的 试验 的 一 个 挑战 是 要 知道 我 们 正在 试图 测量 的 程序 的 实际 运行 时 间 。 内 有 这 样 ， 我 
们 才能 确定 我 们 测量 的 准确 性 。 我 们 知道 ， 只 要 我 们 正在 测量 的 计算 不 被 中 断 ， 我 们 的 周期 计时 器 
就 能 够 给 出 准确 的 结果 。 对 于 比 计数 器 间隔 “ 短 很 多 的 计算 ， 运 行 丰 负载 很 轻 的 机 器 上 时 ， 被 中 断 
的 可 能 性 很 小 ， 我 们 利用 这 些 属 性 来 获得 对 真实 运行 时 间 的 可 靠 估计 值 。 

根据 我 们 的 测量 日 款 ， 我 们 使 用 了 一 个 过 程 , 它 反复 地 往 个 2048 个 整数 的 数组 中 写 信 ， 然 后 
HERR, ELF clear cache 的 代码 。 通 过 设置 重复 的 次 数 r， 我 们 可 以 创建 需要 一 定时 间 的 计算 ， 
汪 先 ， 我 们 设 这 个 过 程 期 望 的 运行 时 间 为 上 的 一 个 函数 ， 用 TD 来 表示 ，r 从 1 变 到 10， 对 运行 时 
国 计 时 《得 到 的 时 间 为 009 一 09ms)， 执 行 最 小 二 乘 方 拟 合 ， 找 到 形 如 TD = mr +b 的 公式 ， 通 过 
ЕН АЕ ИВ. HED r 的 值 执行 100 次 测量 ， 井 且 在 一 个 负载 很 轻 的 系 续 上 运行 测量 ， р 
ЖЧ A ERRER TORRAS. KUHE ЕРТН А Т(т) = 49273.47 + 166 (单位 为 时 
钟 周期 ) 拟 合 这 些 数 据 ， 最 大 误差 小 于 004%. НАТОНЕН ЕТАН SERE B SE c 
19 ЕУ 18], ix NIS де cS T EA 

АЛ» ИНК 次 最 优 方法 来 测量 性 能 ， 参 数 K= 3. є = 0.001, 而 M = 30. XIX] AR rH 
从 进行 这 个 测量 ， 状 得 的 预期 运行 时 间 的 范围 是 各 27 一 50ms。 对 于 得 到 的 每 个 测量 值 Mtm， 我 们 用 
Ен) = (М(г) - TDJTO 来 计算 测量 误 善 EDn。 基 9.14 展示 了 在 一 个 Intel Pentium Ш 十 运行 Linux 


6 Wis LSU ME EARS S -个 进程 的 时 间 段 。 一 一 译 者 
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的 系统 中 ， 对 K 次 最 优 方法 的 一 个 试验 验证 ， 在 这 张 图 中 ， 我 们 给 出 了 作为 TD 的 一 个 函数 的 浏 量 
WA En(r)， 这 里 我 们 给 出 的 TD 的 单位 为 ms。 注 意 ， 我 们 是 以 对 数 尺度 来 显示 Е (г): ERKE 
线 代 表 测 量 误差 的 一 个 数量 级 ， 为 了 使 准确 率 在 1 免 之 内 ， 我 们 必须 让 误差 全 0.01 以 下 。 我 们 不 试 
图 显示 和 任何 小 于 0.001 《也 就 是 0.1 免 ) 的 谋 差 ， 因 为 我 们 的 测试 环境 不 提供 这 么 高 的 精度 。 
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914 КЖ КАШЛЫ Linux 系统 上 的 验证 
当 执 行 时 间 最 高 为 8 шз 时 ， 我 们 ЕЗЕН ER ЛЕШ ИГЕН 《误差 大 约 在 0.1960. ШЕШШ. ñA 3833200815 E 
我 们 过 到 的 系统 过 高 估计 大 约 是 4 名 一 6 号 ， 而 在 负载 比较 鲁 的 机 器 上 ， 结 果 就 更 美 。 


这 二 组 数据 表明 的 是 在 种 不 辣 负 载 情 况 下 的 误差 。 我 们 看 到 ， 在 所 有 三 种 情况 中 ， 运 行 时 
间 小 于 六 约 7.5 ms 的 测量 都 非常 准确 。 因 此 ， 我 们 的 方法 可 以 用 来 在 负载 很 重 的 机 器 上 测量 相对 
比较 短 的 执行 时 间 。"“ 负载 1” 那 组 数据 表明 的 是 只 有 一 个 活动 进程 的 情况 。 对 于 大 于 10ms 的 执 
ТЕТ, {И Tu 全 都 会 过 高 估计 计算 时 间 Т, 大 约 4 吡 一 56 名。 过 高 估计 是 因为 花 了 时 间 来 处 理 
睹 时 器 中 断 。 这 些 数据 与 图 93 АШ trace 一 致 ， 这 个 trace 表明 即使 是 在 678185 
上 ，-= 个 应 用 程序 也 只 能 执行 959-969 НІНІЗ. ^ 负载 2” 和 “负载 11” 邦 贡 组 数据 展示 的 是 还 
有 其 他 进程 在 执行 时 的 性 能 。 在 这 两 种 情况 中 , 对 于 超过 大 约 7 ms 的 执行 时 间 测 量 值 不 准确 得 离 
谱 。 注 意 ， 误 盖 1.0 就 意味 着 Т„ 是 T. 的 两 倍 ， 而 误差 10.0 AARE TETH O . ИНИ. 
铝 作 系统 调度 等 个 活动 进程 一 个 计时 器 间隔 “。 当 有 am 个 活动 进程 时 ， 每 个 进程 只 获得 Lm 的 处 理 
器 时 间 。 

根据 这 些 结果 ， 我 们 可 以 得 出 结论 说 ， 玉 次 最 优 方 法 提供 了 对 非常 短 时 间 计 算 的 准确 结果 。 对 
于 测量 超过 大 约 7 ms 的 执行 时 间 ， 这 种 方法 真 的 不 够 好 ， 特 别 是 还 有 其 他 活动 进程 时 ， 

不 侍 的 是 ， 我 们 发 现 我 们 的 测量 程序 不 能 可 靠 好 确定 它 是 否 获得 了 准确 的 测量 值 。 我 们 的 测量 
过 程 计算 它 的 误差 为 Br = (w - viD)ywi， 这 里 上 是 第 1 个 最 小 的 测量 值 。 也 就 是 ， 它 计算 的 是 这 个 


7 原文 是 time interval, MRI AE timer interval. 
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ЕЖЕ ВАГНЕР REPRE BUE. АПА В В ЧАРК T. 即使 是 对 于 负载 11 的 情况 ， 
测量 值 的 偏 移 达 到 了 10 6, ВРА ААН aE | F 0001. 

设置 кй 

在 我 们 前 面 的 试验 中 ， 我 们 任意 选择 参数 KK 的 值 为 3， 即 为 了 结束 整个 测量 过 程 ， 在 我 们 的 济 
量 结果 中 至 少 有 3 次 的 测量 值 相 比 于 最 快 测量 值 闽 的 误 姜 在 一 个 指定 因子 内 : ATEA A RR 
个 因素 的 影响 ， 我 们 使 玉 的 值 从 1 变化 到 $35， 并 进行 了 一 组 测量 ， 如 图 9.15 Pros. REETA N 
量 的 执行 时 间 范 围 到 了 9 ms， 因 为 这 是 我 们 的 方法 能 够 锋 得 有 用 结案 的 时 间 上 限 ， 


Intel Рат ili, Linux 
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4915 k 次 或 优 方法 中 不 同 k 值 的 效果 
坚 想 有 合理 的 准确 性 ，K 必须 至 少 为 2。 当 程序 时 间接 近 于 计时 器 间隔 时 ， 在 负载 很 重 的 系统 上 上， 大 于 2 的 值 会 有 帮助 一 些 。 
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4915 k XN CAE КНМ (8) 
当 K = 1]. FHT- KAER. HEARE. ХЕ НК ЖАР АНЕ, ЕЛЕНА 
载 很 重 的 时 候 。 如 果 蜀 好 发 生 了 计时 器 中 断 ， 结 果 就 更 不 准确 了 。 即 使 没有 发 生 这 样 的 灾难 ， 测 量 
值 也 容易 受 很 多 因素 的 影响 ， 次 得 不 准确 。 将 K 设置 为 2 就 极 大 地 改善 了 准确 性 ， 对 于 小 于 Sms 
的 执行 时 间 ， 我 们 得 到 的 准确 性 都 大 于 0.190. K 设置 得 越 大 ， 结 果 的 一致 性 和 淮 克 性 就 越 好 ， 真 到 
大 约 8ms 的 上 限 。 这 些 试验 表明 我 们 最 初 猜想 的 民 =3 是 个 合理 的 选择 ， 
补 柑 对 计时 器 中 断 的 处 理 
计时 器 中 断 的 发 生 是 可 预测 的 , 在 我 们 的 执行 时 间 超 过 大 约 7 ms 的 测量 中 , Tiy as rh RE 
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很 大 的 系统 试 差 。 通 过 从 一 个 程序 测量 出 的 运行 时 间 中 碱 去 一 个 花 在 处 理 计 时 器 中 断 上 的 时 间 的 估 
ҰЯ, КАМА АВРО. НЕЙ МА Ж: 

1 我 们 必须 确定 处 理 “S AFBLSCHE ЖЕН. 为 了 保持 我 们 从 不 低 全 过 程 的 执行 时 间 这 - 7 
RE BIZARE 一 个 计时 器 中 潜 所 需 的 最 小 时 钟 周期 数 。 这样 的 话 , 我 们 永远 不 会 过 度 补 偿 。 

2, 我 们 必须 确定 在 我 们 测量 的 时 间 段 内 发 生 了 多 少 次 计时 器 中 断 。 

ЁН ADU РЕН 9.3 和 图 9.5 Ф л trace 的 方法 ， 我 们 可 以 发 现 不 活动 的 时 间 段 ， 并 磺 定 它 
习 有 的 持续 时 间 。 这 些 不 话 助 时 间 段 ， 有 些 是 出 计 对 器 中 断 造 成 的 ， 有 坚 是 由 其 和 他 系统 事件 造成 的 。 
我 们 可 以 确定 使 用 times 过 程 是 百 会 发 生计 时 器 中 断 ， 因 为 每 次 发 生计 时 器 中 断 时 ， 它 的 返回 值 会 
增加 ЕЕ. RIIE 100 个 不 活动 周期 进行 这 样 一 个 评估 ， 发 现 最 小 的 计时 器 中 断 处 理 时 间 段 质 
X 251 466 个 周期 ， 为 了 确定 我 们 正在 测量 的 程序 执行 期 间 发 生 的 让 时 器 中 断 识 数 ， 我 们 简单 地 调 
H times 丙 数 两 泌 一 一 一 次 在 程序 之 前 ， “次 在 程序 之 后 ， 然 后 计算 它们 的 差 。 

8 9.16 展示 了 这 种 改进 过 网 测量 方法 所 获得 的 结业。 如 图 中 所 示 ， 现 存在 负 载 很 壮 的 检 右 上， 
名 和合 吓 对 执行 多 个 时 间 间 隔 的 程序 ,我 们 也 可 以 得 到 非常 准确 СЕ 1099 2 D. 的 测量 值 了 。 通 过 去 
Pila TRA RARE MERITAT 个 非常 可 千 的 测量 方法 。 另 - 方面 ， 我 们 可 以 看 到 这 种 
补偿 对 运行 广 焦 载 很 重 的 机 句 上 的 程序 没有 帮助 。 
intel Pentium IIl, Linux 
HG VERI SR h ñ tt Ba 
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ШЕ CPU 时 间 (тө) 
6916 ЖЕТШЕ БЕТИНЕ ЛЖ 
x EHE „ҢЫ Г {ЕЙ ЖИН ЕТИЛИП ПИНК E nt 
ИЖЕ КЕН 
[8] 28 ATTI Zr S BREACH ERR EHE RES RUE ЕЩ, MAURIE НАЕ ARAR EXER T 
试验 : 


І. 1:47 Linux AREIA (20.36 和 2.2.16) 的 Intel Pentium HI. 
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2. 运行 Windows-NT 的 Intel Pentium Ш. АТН Н КЕ 1А32 Ж НН, E E tE 
系统 与 Linux 完全 不 同 。 

3. 运行 Tm64 Unix 的 Compaq 和 ipha。 它 使 用 的 是 -个 非常 不 同 的 处 理 器 ， 但 是 操作 系统 类 羽 
T Linux. 

nig 9.17 Eros, АЛА ЖЫ Linux КЕНЕ АЕ DE. ОЕ КН Е, У-РД,У 
TARERE ЖЕННИ ORRA., RIAM, НЕ Ж Ч Linux, ЖЖЖ 
Я ВРИЕ TUS 3 500 个 周期 ， 即 使 是 在 负载 很 重 的 机 器 上 ， 它 多 许 进 程 一 次 最 
多 运行 大 约 180ms。 这 个 试验 表明 操作 系统 的 内 部 细节 会 极 大 地 影响 系统 性 能 和 我 们 获得 准确 测量 
EEREN 


inte Pentium ill, Linux 
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89.17. K 次 量 优 测量 方法 在 使 用 较 老 内 核 版 本 的 A 27 nux 系统 上 的 试验 验证 
在 这 个 系统 上 ， 即 使 旦 对 有 较 长 执行 时 间 的 程序 ， 特 乔 是 在 负载 很 轻 的 机 器 上， 我们 也 能 获得 更 准确 的 测量 值 。 


图 9.18 Жол ГЕ Windows-NT 系统 上 的 结果 。 总 地 来 说 ， 这 些 结果 类 似 王 那些 较 老 Linux 系统 的 
纲 果 。 对 于 得 时 间 和 的 计算 ， 或 者 在 负载 很 轻 的 机 器 上 ， 我 们 可 以 获得 准确 的 测量 值 。 在 这 种 情况 中 ， 
我 们 的 准确 度 是 大 的 和 OH〈 也 就 是 1.0%) 而 不 是 0.001。 不 过 ,对 于 大 多 数 应 用 来 说 ,这 就 足够 好 了 。 
另外 ， 在 负载 很 重 的 机 器 上 ， 我 们 可 靠 的 和 不 可 靠 的 汕 量 值 之 问 的 门限 值 大 约 是 48ms。 一 个 有 趣 的 
特性 是 ， 有 时 候 在 负载 很 重 的 机 器 上 ， 即 使 是 对 最 长 245 ms 的 计算 ， 我 们 也 能 够 获得 准确 的 测量 值 。 
VIA. NT 的 调度 器 有 时 候 会 允许 进 程 保持 活动 较 长 的 一 段 时 间 ， 但 是 我 们 不 能 依靠 这 休 属 性 ， 

Compaq Alpha 的 结果 如 图 9.19 所 示 。 我 们 再 次 发 山 ， 在 负载 很 轻 的 机 器 上 ， 几 乎 尾 意 特 续 时 
站 的 程序 测 基 出 来 的 误差 都 小 于 1.0%。 在 负载 很 重 的 机 器 上 ， 只 有 持续 时 间 小 于 大 约 10ms 的 程序 
才能 被 准确 测量 。 
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89.18. 上 次 是 优 测量 方法 在 WindowsNT 系统 上 的 试验 验证 


ЧЕКДЕ 上， 我 们 总 是 能 装 得 准确 的 测量 第 (误差 大 约 为 1.0 锅 )， 在 鱼 载 很 和 章 的 机 器 上 ， 对 于 时 长 大 丁 厂 约 48шз 的 
ты, EEEE E. 
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图 9.19 K 次 明 优 测量 方法 在 Compaq Alpha 系统 上 的 试验 验证 


对 于 父 载 很 烃 的 系统 ， 我 们 总 是 能 获得 准确 【 误 关 < 10%) 的 测量 值 。 对 于 负载 很 重 的 系统 ， 大 于 LOms 的 持续 时 间 就 不 能 
ЙН ПШ Т. 


$38 97 
假设 我 们 希望 测量 一 个 需要 tms 的 过 程 。 机 器 的 负载 很 重 ， 因 此 不 允许 我 们 的 测量 进程 一 次 运 
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行 超过 50ms. 

А. 每 次 恋 验 都 包括 测量 这 个 过 程 的 一 次 执行 ,假设 一 次 试验 从 50 ms 时 间 段 中 某 个 任意 时 间 点 
开始 ， 多 许 这 次 试验 庆 行 完成 而 不 会 被 交换 出 来 的 概率 是 多 由 ? 将 你 的 答 业 表示 咸 t 的 一 个 函数 ， 
考虑 所 有 可 能 的 t 的 值 。 

B. 为 了 使 其 中 网 三 次 测 童 是 这 个 过 程 的 可 千 测 童 (也 就 是 , 那些 在 一 个 了 时 间 段 之 内 完成 的 运行 )， 
预期 所 需 的 测 重 次 数 是 多 少 ? 将 你 的 答 当 表示 成 1 的 一 个 函数 ， 体 预测 t= 20 和 t= 40 时 这 些 秆 应 该 
x $y? 

NE 

这 些 试 验证 明天 次 最 优 测 量 方法 在 多 种 机 器 上 都 工作 得 相当 好 。 对 于 负载 很 轻 的 处 理 器 ， 在 大 
ЖЕК, ШЇ ХЕКЕ НН T, ЕДЕННЕН. ПТН ДЕН Linux £8 
致 非常 高 的 计时 器 中 其 开销， 严重 影响 测量 的 准确 性 。 对 于 这 个 系统 ， 补 偿 这 种 开销 会 圾 大 地 提高 
测量 的 准确 性 。 

在 负载 很 重 的 机 器 上 ， 当 执行 时 间 变 得 比较 长 时 ， 获 得 准确 的 测量 值 变 得 很 困难 。 大 多 数 系统 
都 有 某 个 最 大 执行 时 间 ， 当 最 大 执行 时 间 超 出 了 测量 和 界限， 那么 准确 度 会 变 得 非常 糟糕 ， 这 个 门限 
ЕЮ РАЯ, НЕЕ 是 在 10 一 200ms 27|8|. 


9.5 基于 gettimeofday 函数 的 测量 


我 们 对 1A32 ЯНИ ЖЕКИ RESET RR MERE, CECENE, RUE H LIEGE 
IA32 RAL. ЕН — tn ЕНЕ ЛА. ЗТ Е РА 81 times 和 clock 是 用 间隔 计 
数 器 来 实现 的 ， 因 此 不 是 十 分 准确 。 

及 一 个 可 能 性 是 使 用 库 冰 数 gettimeofday。 这 个 函数 查询 系统 时 钟 (system clock) 以 确定 当前 
的 日 期 和 和 时间。 


include "time.h" 


struct timeval 4 

long tv sec; /* Seconds */ 
long tv usec: /* Microseconds */ 
} 


int gettimeofdayí(struck timeval *rtv, NULL); 





HA: 车 虑 功 则 为 0， 落 失败 则 为 -1， 


这 个 遂 数 把 时 间 写 入 到 一 个 调用 者 传递 过 来 的 结构 中 ， 这 个 结构 包括 一 个 单位 为 8 的 字段 ， 还 
有 一 个 单位 为 hs 的 字段 。 第 一 个 字段 存放 的 是 自从 1970 年 1 月 1 日 以 来 经 过 的 总 秒 数 对 丁 所 有 
的 Unix 系统 来 说 , 这 都 是 一 个 标准 的 参考 点} 注意, 在 Linux RAL, gettimeofday 的 第 二 个 参数 ， 
应 该 简单 地 置 为 NULL， 因 为 它 指向 一 个 未 被 实现 的 执行 对 区 校正 的 特性 。 


155) 9.8 Us 
在 一 个 32 @ЛА@ L. ЖҰМҒАН 38 gettimeofday Е A E] tv. sec етте Ж? 
如 图 9.20 所 示 ， 我 们 可 以 用 gettimeofday ЖЫННАН Ж start, timer 和 get timer, €f] 
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ЭМИР ПА ИННА, ER ETT RE RICE Fb ur, ОЕ АТАДА А АУ ЇЇ]. 


code/perf/tod.c 

1 #1псіцде «gsys/Llme.h- 

2 dinclude «uniszd.h» 

3 

4 static struct Limeval tg-art; 

5 

6 /* Record current time */ 

7 void start_Limer |, 

B { 

E getLimeofday(&tstart, NULL); 

10 | 

11 

12 /* Get number of seconds since last call to start. timer */ 

1i double get timeri) 

14 | 

15 struct timeval tfinish; 

16 long sec, usec; 

l1 

18 gettimeofday(&t£inish, NULL); 

19 чес = tfinlsh.tv sec - tstart.tv sec; 

20 usec = tfinish.tv usec - tstart.Lv usec; 

21 return sec + le-6f*usec; 

22 j 
Tom  code/perfftod.c 


9.20 “ЯН Unix gettimeofday 的 计时 过 程 
AX BH bd] ERA ET RE. IB RE Я T m] Bb EBD ЗЕР. 


XX Th vEHEBUB fT. gettimeofday 是 如 何 实现 的 ,而 gettimeofday BJ ЕЮ E BE ЖС A Ja] ü А: 
IS. ЖААТ" Дуз 为 单位 的 测量 值 看 上 去 非常 好 ， 但 是 事实 证 明 测 量 值 并 不 总 是 那么 
准确 .图 9.21 展示 了 在 几 个 不 同 的 系统 上 测量 这 个 函数 的 结果 ,我 们 定义 消 数 的 分 辩 度 (Tesolution) 
为 计时 器 可 以 分 辨 的 最 小 时 间 值 。 我 们 通过 反复 调用 gettimeofday 直到 写 到 第 一 个 参数 的 值 改变 
了 ， 来 计算 这 个 值 。 那 么 ， 分 状 度 就 是 它 改 变 了 的 bs 数 。 正 如 这 张 表 所 省 ， 有 些 实现 实际 上 可 以 
分 辨 hs 级 的 时 间 ， 而 另 一 些 就 没 那么 精确 了 。 有 这 样 一 些 差 别 ， 是 因为 有 些 系统 用 周期 计数 器 来 
头 更 这 个 参数 ， 而 其 他 系统 是 用 间隔 计数 的 。 在 前 者 那 种 情况 中 ， 分 辨 度 可 以 非常 高 一 一 浴 在 地 
高 十 数据 表示 提供 的 Ims 的 分 辨 度 。 在 后 面 那 种 情况 中 ， 分 辨 度 会 很 糟 粒 一 一 几乎 和 函数 times 
ЖІ clock 提供 的 相当 ， 

图 9.21 还 展示 了 在 各 种 系统 上 调用 get. timer 所 需 的 执行 时 间 Claency), ЖЖ ТН 
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W RB ЕН A S e). Ped 38 НАСА СА Л Г 15, ЕНІ 队 以 调用 的 次 数 ， 
来 计算 这 个 值 。 正 如 看 到 的 那样 ， 在 大 多 数 系统 上 ， 这 个 函数 调用 需要 大 约 lms， 而 在 其 他 系统 上 
需要 儿 个 ms。 相 比 之 下 ， 我 们 的 过 程 get counter 每 次 调用 只 需要 大 约 0.2ms。 一 般 而 言 ， 系 统 调用 
比 普通 的 函数 识 用 需要 更 名 的 开销 。 这 个 执行 时 间 还 限制 了 我 们 测量 的 精确 度 。 即 使 数据 结构 允许 
以 更 高 分 辩 度 的 单位 来 表达 时 间 ， 但 是 当 每 次 测量 引起 这 么 长 时 间 的 延迟 时 ， 我 们 还 是 不 清楚 能 够 
多 人 么 准确 地 测量 时 间 ， 


Pentium ЇЇ, Winüows-NT 10 000 5.4 
2 1.1 
81921 gettimeofday 实现 的 特性 


存 些 实现 使 用 的 是 问 交 计数 ， 而 其 他 的 使 用 的 是 周期 计时 器 。 这 极 大 地 影响 了 测量 的 精确 性 。 
图 922 展示 我们 从 一 个 使 用 gettimeofday MAERT B сой) ARR un fal FS RE VIE CIR K IX 


t£ FH aettimeofday 
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图 922 ЕН gettimeotday ЕК 次 最 优 测 量 方法 的 试验 验证 
Linux 是 用 周期 计数 器 来 实现 这 个 硝 数 的 ， 所 以 精确 度 与 我 们 的 计时 重 程 一 样 。Windows-NT 用 间隔 计数 来 实现 这 个 后 数 的 ， 
因此 精确 度 银 低 ， 特 别 是 对 于 类 的 持续 时 间 来 说 。 


200 250 300 
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йе АЛИ CD ERMEER. ПЕК ЕЖЕЛ ІНЕ, LR ІН ЕДІ 
确 性 的 影响 。 (1. Windows-NT 系统 上 的 测量 和 什 表 明 的 特性 类 似 于 我 们 在 Linux. 系统 上 使 用 times 
时 发 现 的 特性 《图 9.8)。 因 为 gettimeofday 是 用 进程 计时 器 来 实现 的 ， 所 以 误差 叮 能 是 负 的 ， 也 
中 能 是 正 的 ， 对 于 短 持 续 时 间 的 测量 ， 区 其 不 规律 。 对 于 较 长 的 持续 时 间 ， 准 确 性 有 所 改进 ， 自 
到 对 于 超过 200ms 的 持续 时 间 误 差 小 于 2.090 8]. Æ Linux 系统 上 测量 值 络 出 的 结果 类 似 于 直接 使 
用 周期 计数 器 时 得 到 的 结果 ,通过 比较 图 9.14 中 负载 1 结果 的 浏 量 值 (没有 进行 补偿 ) 和 图 916 
中 结 打 的 测 最 值 【 进 行 了 补偿 )， 可 以 看 出 这 -上 点。 使 用 了 补偿 ， 即 使 是 对 长 达 300ms 的 测量 ， 
我 们 也 可 以 获得 好 于 0.04% 的 准确 度 。 因 此 ，gettimeofday 与 直接 访问 这 台 机 器 上 的 周期 计数 器 完 
成 得 一 样 好 ，。 


96 кз: 一 个 实验 协议 


Fn A РАНА Ash -上 我 们 的 试验 发 现 ， 来 确定 如 何 回答 这 个 问题 “各 序 X 在 机 器 
Y 上 运行 得 有 允 快 ? “” 

* ШАХ HHR TERE Chris. KT 1.0s)， 那 么 间隔 计数 应 该 就 工作 得 是 够 好 了 ,而 
Н А REESE ТА КЕ. 

* ШАХ 预期 的 运行 时 间 在 范围 大约 0.01—1.0s 之 间 ， 那 么 在 负载 很 轻 的 系统 上 ， 使 用 准确 
的 、 基 于 周期 的 计时 来 进行 测量 就 往 重 昌 了 。 我 们 应 深 执行 gettimeofday EARME, 
来 确定 它 在 机 器 Y 上 鸭 实 现 是 基于 周期 的 ， 还 是 基于 间隔 的 ， 

4 如 果 函 数 是 基 寺 周期 的 ， 那 么 用 它 作 为 下 次 最 优 计 时 函数 的 基础 。 
e 如 朱 明 数 是 基于 间 胡 的， 那么 我 们 必须 找到 一 些 使 用 机 器 的 周期 计数 器 的 方法 。 这 可 
BE zd EIAS B NI. 

* 如 果 式 预期 的 先行 时 间 小 于 大 约 0.018, 那么 只 要 使 用 的 是 基于 周期 的 计时 ， 即 使 是 在 负载 
TEILE 上， 也 可 以 完成 精确 的 测量 。 录 么 ， 我 们 着 手 用 gettimeofday 或 直接 访问 机 器 
的 周期 计数 器 ， 来 实现 -个 长 次 最 优 计时 函数 。 


9.7 展望 未 来 


系统 中 引入 了 几 个 对 性 能 测量 有 很 大 影响 的 特性 : 

e 与 过 程 相关 的 周期 计时 。 对 于 操作 系统 来 说 ， 管 理 周 期 计数 器 相对 比较 穷 易 ， 所 以 它 指明 
了 茶 个 进程 经 过 的 周期 数 。 那 么 ， 当 进程 重新 变 为 活动 时 ， 周 期 计数 器 被 设置 为 当 进 程 上 
ЖАНА) (deactivated) 时 它 的 值 ， 在 进程 不 活动 时 有 效 地 冻结 计数器。 当然， 计数 器 还 
是 会 这 丹 核 操作 并 销 和 高 速 缓存 的 影响 的 ， 人 得 是 至 少 其 他 进程 的 影响 不 会 很 严重 。 已 经 有 
一 些 系 统 支 持 这 个 特性 了 。 根 据 我 们 的 协议 ， 这 允许 我 们 使 用 基于 周期 的 计时 来 获得 大 十 
AJ 0.015 持续 时 间 的 准确 测量 值 ， 邵 使 是 在 负载 很 重 的 机 器 上 。 

° 籽 率 变化 的 时 钟 。 为 了 降低 功 耗 ， 未 来 的 系统 会 改变 时 钟 频率 ， 因 为 功 耗 肯 接 与 时 钟 频 
率 相 关 。 在 那 种 情况 中 ， 我 们 不 会 有 时 钟 周期 与 ns 之 间 的 … 个 简单 的 转换 。 其 至 干 很 
难 知 道 应 该 用 哪个 单位 来 表达 程序 性 能 。 对 于 代码 优化 器 ， 通 过 计算 周期 ， 我 们 能 获得 
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98 ”现实 生活 : K 次 最 优 测量 方法 
我 们 创建 了 一 个 库 函 数 fyo CEM K 次 最 优 方 法 来 测量 函数 了 所 需要 的 时 钟 周期 数 


Жіпсізде "c.ock.h" 


include "fcvc.h" 


typedef void l*test funct)lint *); 


double fcycibtest funct f, int *params); 


返回 : 运行 参数 params H AK f Arb Н] ЖЖ, 





参数 params 是 一 个 指向 整数 的 指针 。-- 般 而 言 ， 它 可 以 指向 一 个 整数 数组 ， 这 个 数组 是 被 测量 
КЖ ЕЖ. ӨШ, ИЕ АУНАЙ озегі 和 lower 时 ， 我 们 传递 一 个 指向 一 个 int ЗЕ 
针 作 为 参数 ， 它 是 要 转换 的 字符 串 的 长 度 ， 在 产生 存储 器 山 【 第 6 章 ) I. БАП ЕН — ҮН 
癌 大 小 为 2 的 数组 的 指针 ， 其 中 包括 大 小 利 步 长 。 

有 很 多 控制 测量 的 参数 , ИШК. к HIM 的 值 ， 以 及 在 每 次 测量 之 前 是 否 要 清除 高 速 缓存 。 可 
以 用 则 样 在 这 个 库 中 的 郴 数 来 设置 这 些 参数 【详情 请 参见 文件 feyc.h)。 


99 得 到 的 经 验 教 训 


通过 设计 一 种 蕉 确 计 对 方法 ， 以 及 在 许多 不 同 的 系统 上 评价 这 种 方法 的 性 能 的 努力 ， 我 们 学 到 
І ане. 

。 每 个 系统 都 是 不 同 的 。 关 于 硬件 、 操 作 系 统 和 库 函 数 实现 的 网 节 对 可 以 测量 哪 种 程序 以 及 
TH SUR RI CLA PEE IPS HRK EUER 

° 试验 可 以 是 非常 有 启迪 性 的 。 通过 运行 简单 试验 以 产生 活动 trace 的 方法 ， 我 们 获得 了 对 操 
作 系 统 调度 程序 的 深入 了 解 。 这 产生 了 补偿 方法 ， 它 极 大 地 提高 了 在 负载 很 轻 的 Linux Ж 
统 上 的 准确 性 。 一 个 系统 与 习 一 个 系统 是 不 同 的 ， 即 使 是 一 个 OS 内 核 也 与 下 -个 版 本 的 
不 同 ， 能 够 分 析 和 理解 影响 一 个 系统 性 能 的 各 个 方 血 是 很 重要 移 。 

e 在 负载 很 重 的 系统 上 获得 准确 的 计 守 特别 困难 。 大 多 数 系统 研究 者 在 专门 的 基准 系统 上 进 
行 他 们 所 有 的 测量 。 他 们 常常 关 掉 系 统 的 许多 OS 和 网 络 特性 ， 以 减少 会 引起 不 可 预测 活 
动 的 因素 。 不 这 的 是 ， 普 通 的 程序 员 没 有 这 么 奢 修 。 他 们 必须 与 其 他 用 户 共 享 又 统 。 邯 使 
是 在 负载 很 重 的 系统 上 ， 我 们 的 K XE ix WE RT VERI ЕНЕ КЕНЕЕН Жі, 
也 是 祖 当 健壮 的 。 


* 试验 建立 必须 控制 一 些 造成 性 能 变化 的 因素 ， 高 速 缓存 能 够 极 大 地 影响 一 个 程序 的 执行 时 
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[E]. ТЁК ЧЕЖЕ ЕЛП? B. НЕ ЕТІН ПІ НІНІ ОЖ, GOES. 
Т ZR E SR 47 H RJ Pr A ӨЕЛЕШЕП Ж. 
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ЖЕҢИН ИЕ ТШШ ЖАН ЕШ: E X 在 机 器 У НЕПЯН ЖЫ” АЕМЕ. И 
Т, ЖЖЖ XR TI КЕН ЕНЕНЕ HR ERE E ЕЕ ЕБІН. Raia TE 
个 下 何刚 时 间作 度 了 上 进行， 在 微观 级 别 上 上， 每 条 指令 执行 的 时 间 十 以 ns 来 衡量 的 。 在 宏观 级 别 L. 
ЛНУ Н ЖЕШ ШОКЕ ms 来 衡量 的 ， 计 算 机 系 绕 通 过 不 断 地 从 一 个 任务 切换 到 有 刃 - -个 任务 
来 利用 这 种 差异 ， 一 次 运行 若干 ms. 

计算 机 系统 有 了 商 种 完 件 不 同 的 记录 时 间 流 逝 的 方法 。 从 宏观 衣 度 来 看 ， 计 时 器 中 断 (timer 
interrupt) A E S 338 84k, 但 是 从 微观 的 角度 来 看 却 很 慢 , 通过 间隔 计 娄 (interval counting), 
系统 能 够 获得 对 程序 执行 时 间 的 非常 粗略 的 测量 值 。 这 种 方法 上 只 对 长 持续 时 间 【 至 少 1s) 的 测量 
ДІҢ. АНИ NOR (cycle counter) 非常 快 ， 可 以 得 到 在 微观 尺度 上 很 好 的 测量 值 。 对 于 测量 结对 
计 问 的 周期 计数 风 ， 上 下 文 切 换 的 影响 能 够 导致 很 小 【在 负载 很 轻 的 系统 上 ) 到 很 太 《 在 负载 很 
重 的 系统 上 ) 的 误 凑 ,因此 ， 汕 有 方法 是 完美 的 。 理 解 在 - -个 特殊 的 系统 上 能 够 获得 的 准确 上 度 是 
很 重要 的 。 

取 妆 于吉 面 存储 器 中 用 和 条 和 件 分 支 的 历史 ， 商 速 钥 存 和 分 支 预 测 的 影响 可 以 导致 执行 代码 
HJ А R Br НЕ BJ hj [aj АИКА АЫ. 通过 事先 运行 某 些 将 高 速 媛 存 设 置 为 可 预测 状态 的 代码 ， 
我 们 可 以 部 分 地 控制 引起 这 种 变化 的 因素 ， 但 是 在 有 上 下 文 切换 发 生 时 ， 这 些 党 试 就 没有 用 了 。 
因此 ， 我 们 必须 进行 多 次 测量 ， 分 析 结 果 ， 以 确定 真实 的 执行 时 间 ， 幸 运 前 是 ， 所 有 引起 变化 
的 内 泰 的 效果 都 是 增加 执行 时 间 ， 因 此 只 需 分 析 确 定 测 出 的 时 间 的 最 小 值 是 否 是 一 个 准确 的 测 
и. 

Ж ЖАШКА, ЕПЕРЕИЯЛНКШК 议 最 优 计 时 方法 ， 这 里 或 们 反复 进行 测量 ， 自 到 
RRR K 个 值 都 在 某 个 互 机 接近 的 范围 之 内 了 。 在 一 些 系 统 上 ， 我 们 能 够 使 测量 用 库 荫 数 来 确定 时 
н). (EX) - ЖА Г, 我们 必须 通过 汇编 代码 来 访问 周期 计数 器 ， 

参 者 文献 说 阴 

XB SAIS. Stevens 的 Unix 编程 著作 [81] 记 录 了 程序 计时 的 所 有 各 种 库 寺 
数 。Wadleigh 和 Crawford HX THIRE КІ ОТЕ Т КЕЗЕННЕН Ж. 
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根据 图 9.3 所 示 trace 问答 下 列 问题 ， 我 们 的 程序 估计 时 钟 频率 为 549.9MHz. XAR. НАЙ 
期 计数 伯 来 计算 trace 中 的 毫秒 计时 导 。 也 就 是 说 ， 对 于 一 个 以 周期 来 表示 的 时 间 e， 程 序 计 算 毫 
砂 计 时 值 为 cf549900。 不 幸 的 是 ， 程序 估计 时 钟 频 素 的 方法 不 完善 ， 因 此 有 些 毫 秒 计时 值 不 太 淮 
Hu. 

.这 个 机 器 的 计时 器 间隔 为 10ms。 这 些 时 间 段 中 的 哪些 是 由 计时 器 中 断 发 起 的 ? 

B. 根据 这 个 trace， 操 作 系 统 服 务 - -个 计时 器 中 断 所 需 的 最 小 时 钟 周 期 数 是 多 少 ? 
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C. 根据 这 些 trace UE, АУРЕ IER E 100ms, АПАНЫН R 3 b? 

9.10 ++ 

i5 RIF, C IERIPEIE SE sleep 和 times 来 博 定 每 秒 时 钟 滴答 的 近似 次 数 。 试 着 在 多 种 系统 
上 编译 并 运行 这 个 程序 。 试 着 找 出 两 个 不 同 的 系统 ， 它 们 产生 的 结果 至 少 相 差 两 倍 ， 

9.11 € 

我 们 可 以 用 周期 计数 器 来 生成 活动 的 trace , ЖЕН 9.3 和 9.5 所 示 的 那样 ,使 用 函数 start. counter 
和 get. counter 来 编写 一 个 也 数 : 


$include "clock.h" 


int inactivedurationíiint thresh}; 





ЖЕ); 非 活动 的 周期 数 ， 


区 个 冰 数 不 断 地 检查 周期 计数 器 ， 并 察觉 什么 时 候 两 个 连续 的 读 之 间 相 差 多 于 thresh 个 周 
期 ， 这 表明 这 个 进程 已 经 处 于 不 活动 状态 了 。 返 回 这 个 不 活动 状态 的 持续 时 间 【 以 时 钟 周期 为 单 
(М). 

912 € 

假设 我 们 以 参数 sleepime 等 于 2 ERI ER mhr 9.10). RAR S 868)  10ті5.45 19 sleep 
是 按照 下 面 这 样 的 方法 来 实现 的 。 处 理 器 维护 一 个 计数 器 ， 每 次 发 生计 数 器 中 断 时 ， 它 都 加 1. 75 
系统 执行 sleep(X) 时 ， 且 当 这 个 计数 器 达到 4+ 100x 时 ， 系 统 谓 度 这 个 进程 重新 启动 ， 这 电 t 是 计数 
器 的 当前 值 。 

А. W w 表示 由 于 调用 sleep， 我 们 的 进程 外 于 不 活动 状态 的 时 间 。 忽 咯 函 数 调 用 、 计 时 器 中 断 
等 各 种 开销 ，w 的 取 值 范围 是 多 少 ? 

B， 假 设 一 次 调用 mhz 得 到 1000.0。 肯 次 忽略 各 种 开销 ， 真 实 的 时 钟 频率 可 能 的 范围 是 多 少 ? 


Es 5) EB 2 Ж 


练习 题 9.1 = $ 

一 开始 ， 中 新 CPU， 并 执行 100 000 个 周期 只 为 了 处 理 - :次 击 键 ， 看 上 去 很 荒唐 。 不 过 ， 当 你 
仔细 研究 一 个 这 些 数 据 ， 就 会 清楚 CPU 上 的 整个 负载 是 相当 轻 的 。 

100 WPM XI NT SER? 10 次 击 键 。100 个 输入 者 每 秒 使 用 的 周期 总 数 会 是 10 x 10^ x 10° = 10), 
也 就 是 处 理 器 能够 提供 的 总 周期 数 的 10 多。 


练习 题 9.2 答案 

这 个 问题 需要 行 绚 地 研究 这 个 race， 这 样 就 会 预期 出 模式 的 类 型 。 

А, 它们 每 9.98—9.99ms ЖЕ—1К: 358,93, 368.01, 378.89, 388,88, 398.56, 408.85. 418.83, 
428.8[。 注 意 ， 设 有 用 斜体 表示 的 那些 数字 是 由 前 面 一 个 时 间 加 上 9.98 得 到 的 。 

B. “A” 中 用 斜体 表示 那些 时 间 。 它 们 引起 一 个 新 的 不 活动 导 期 。 

C. 除了 巷 在 执行 其 他 进程 土 的 时 间 以 外 ， 不 活动 时 间 还 包括 花 在 服务 两 个 中 晰 上 的 时 间 。 
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Г. 我 们 的 进程 每 20.0ms ҚАРА 9.5тв. ШАДЕН] 47.5%. 

练习 题 9.3 答案 

这 道 题 眶 是 简单 节 根 据 正 存 执行 的 进程 标 出 执行 顺序 ， 并 确定 这 全 进程 是 在 用 局 模式 中 还 十 在 
nS. 


LAT. 8 [хл] B T A | А шен 


B 800 + 305 
Au Au As BU Bu Bu Bu Bs Bu As Au Au AU AU Bs Bu BU Bu Ba Au Ав Au Au Au Аз 


练习 题 0.4 答案 


这 是 个 很 有 起 的 思考 题 。 它 帮 雹 你 推 时 出 能 够 导 镍 一 个 给 定 的 间隔 计数 的 可 能 的 时 间 孝 围 。 
КЕНДІ Flip: 


ЖУН 
J AR 





0 10 20 30 40 50 БО 70 80 
А-ГЕ, P WISI ERTE 10 处 的 那个 中 断 乙 前 开始 ， 刚 好 在 时 间 70 处 的 那个 中 断 发 
"EIER ЯТ, НӘРІНЕН 60ms。 对 于 最 大 的 情况 ,片断 刚好 在 时 间 总 处 的 那个 中 斯 之 后 开始 ， 
Hl AR КЖЕ] 80 处 的 那个 中 断 之 前 结束 ， 得 到 总 时 间 刚 好 小 于 80ms. 
练习 题 9.5 答案 
这 个 习题 要 求 思 考 的 是 记 账 (axcouning) 旋 法 上 作 得 如 何 ， 当 进程 是 酒 动 时 ， 发 生 了 7 次 计数 
ЖЕТ» {ЕЗЕК ЇЙ trace 中， 进程 在 用 户 模式 中 运行 了 全 .7?ms， 而 不 内 核 模式 中 运行 了 33ms。 计 数 
虎 过 遍地 们 计 了 真实 的 执行 时 间 7063.7 + 3:3) = 1.04Х. 
练习 题 9.6 ЖЖ 
АЖЖ ЕНН КВА АЕ. МАРАКА ЕН. 
根据 这 些 测量 值 ， 我 们 得 到 上 列 结论 ， 
с+т+р+й= 399 
с+ай= 133 +1 
с+р= 31] 
根据 这 些 结论 ， 我 们 是 以 断定 c= 100. d=33. р= 217, fj m = 49. 
练习 题 9.7 答案 
这 垃 哑 要求 将 概率 论 应 咱 到 个 简单 的 进程 调度 模型 上 , 它 说 明 当 时 咎 接近 村 进程 时 间 极 限时 ， 
dict nS АА E TE ЕЙ. 
A. XE Pa x 50， 和 运行 在 “个 时 间 段 内 的 概率 是 1-850。 对 于 1> 50, PÉ BUE B 0. 
B. M r= 提 ， 我 们 永远 也 不 可 能 得 到 一 次 试验 ， 它 在 一 个 进程 时 间 段 内 执行 完毕 。 对 于 1 < 


RR utri] И] 59] 


50, АНУ R p-(50-0/50. КАТ ЯНЗ Ур = 150/(50- 3X $3. HTF £2 加， 我 们 预期 需 
X 5E. ПІ 40. {ПИЛДИ Ж 15 Ж. 


练习 题 9.8 答案 

这 是 Unix 版 本 的 YOK 问题 有 些 人 宦 测 当时 钟 绕 问 来 时 会 是 一 场 全 面 的 窒 难 。 哎 像 对 符 Y2K 
—H, ЖЕРЕН. 

这 样 的 事情 会 在 970 EI H I RAZ 秒 后 发 生 。 那 会 是 2038 € 1 819 ARA 3:14. 
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ДМ 


595 
596 
997 
501 
504 
604 
514 
622 
627 
648 
652 
856 
557 


593 


594 $10* 


一 个 系统 中 的 进程 是 与 其 他 进程 共享 CPU 种 主 存 资源 的 。 然而 , 共 学 主 存 会 形成 一 些 特殊 的 挑 
战 。 随 者 对 CPU 需求 的 增长 , 进程 以 菜 种 合理 的 下 渭 方式 慢 了 下 来 。 但 是 如 果 太 多 的 进程 需要 太 多 
内 存储 器 memory)， 屠 么 它们 中 的 一 些 将 简单 电 根本 起 法 运行 。 当 一 个 科 友 要 出 空间 上 时， 它 战 会 
成 为 那个 运气 不 好 的 程序 。 

仔 储 器 还 很 容易 被 破坏 ， 如 果 某 个 进程 不 小 心气 了 劝 一 个 进程 使 用 的 存储 器 ， 孝 么 进程 可 能 以 
ЖЕЛЕ ТРЕ А КЪ AERIS Л А, ЖЩ. 

А Т ЖН ЖИЕ ИР ЕЛ H ЬШ. ВИСКИ 了 ЭУ] Ed MEUS, ШЕ АА 
8 СҰМ» ЖИМИ ЕШ ТЕ. HUE EHE. Adr. ЖЕУ ТАРЕ ЖЇН МН. E 
为 每 个 进程 提供 了 一个 大 的 、- XE]. MERHER. ЈА МИНЕ, RETIA M ЛЕЛЕ Т 
Е ВЕ): ЕЕН Е МЕЕ ДЕЯ АВНЕ ЗВ АО ВЕЕ, ded B Oe I 
Dm, Л У Е г [ОТНЕТ Б, ДАТУ, ЕА T dde: VN 
个 进程 提供 Т ИНО: [а], ЛАТТА ТЕРЕН, ҰЛАР ГЕТЕ ТЕ AP ДИ 
ТЕК, 

МЕТ РЛ КЕ EAEL. CRAIN- EE BE ЫЫ УЫ ЖЫЛАН. H 
JELE AIEEBMADERABHER UC. ЖАР А ЕНГ ІЛЕ ЛЕ. ЖАҒАНЫ 
ЮЕШ? SUL FL АШ: 

. AWÄRBEP ut. EIL fe МУР ИСТА ЕТА, НЕЕ. ER. Wk 

Жаз, ДЗ». Қал. {РИЙ ЕНИ ЕЕЕ. БИ ШЕШ ТЕТЕ ЛЕН ИП 
你 更 好 地 理解 系统 通常 是 如 何 工作 的 ， 

* 上 度 拟 夺 储 器 是 强大 的 。 虚 拟 存 储 器 给 予 烹 几 程序 强人 的 能 力 ， 可 以 创建 和 破坏 存储 器 块 、 
将 仔 储 右 岂 映 射 到 倍 盘 文件 的 某 个 部 分 ， 以 及 与 其 他 进程 共享 作 尾 器。 比如 ， 你 知道 你 订 
以 退 过 读 写 行 储 器 位 置 读 或 首 修 发 一 个 位 盘 交 件 的 内 容 吗 ?或 者 是 你 可 以 加 载 :个 文件 的 
内 容 到 存储 器 中 ， 而 不 需要 进行 任何 显 式 地 拷 足 妃 ? 理解 虚拟 存储 器 将 帮助 你 利用 它 的 强 
大 功能 在 你 的 应 用 程序 中 深 加 动 力 。 

e 虚拟 条 储 器 是 危险 的 ,每 次 应 用 程序 引用 一 个 变量 、 间 接 51 用 个 指针 ， 或 者 调用 ЗІҢ 
如 malloc 这 样 的 动态 分 本 包 和 序 时 ， 它 就 会 和 虚拟 存储 器 发 生 交 互 。 如 果 虚 拟 存 储 器 使 用 
不 汪 ， 应 用 将 遇 到 复 孙 险恶 的 与 存储 器 有 关 的 错误 。 例 如 ， “个 带 有 错误 指针 的 程序 可 以 
ЕШИКЕ “Баға” RA “іні”, 它 可 能 在 关 油 之 前 还 默 歌 出 运行 了 儿 个 小 时 ， 眶 
者 是 最 令 人 己 慌 地 ， 运 行 完成 ， 却 产生 不 正确 药 结 果 。 理 解 虚拟 存储 器 ， 以 及 诸如 malloc 
之 关 的 管理 虚拟 存储 器 的 分 配 程序 包 ， 可 以 帮助 你 避免 这 些 错 误 。 

这 -草丛 两 个 角度 来 讨论 虚拟 行 储 器 。 本 章 的 前 一 部 分 描述 虚拟 存储 器 嘴 如 何 上 作 的 ， 后 ”部 
对 指 述 的 古 应 用 称 序 如 何 使 用 和 管理 惠 拟 人 存储器， 大 可 避免 的 事实 是 虚拟 存储 器 很 复 杀 ， 本 音 很 多 
ЖА Гос. КАША ШЖК pote. {КЮЕ ТОГЕ 个 小 系统 的 虚拟 在 储 
顺 机 制 ， 而 及 虚 拟 存储 器 的 概念 将 永远 不 骨 神 秘 ， 

第 “部 分 是 建立 在 这 种 理解 之 上 的 ， 向 你 霸 示 了 如 何在 程 序 中 使 用 和 和 莹 理 虚 拟 存储器 。 你 将 学 
£x M PAESE TARAM LAE KU HR. malloc ЖЕНЕ КТЕ ЧӘ ТИЛЕН ЕГА. ЖЕШЕТ 
Wim. MER TERCET ARE LEO ЕЕЕ OX RI. ЕЗЕТ i MUH N, 
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101 ”物理 和 虚拟 寻 址 


计算 机 系统 的 主 存 被 组 织 成 一 个 由 M 个 连续 的 字 节 大 小 的 单元 组 成 的 数组 ,每 字 节 都 育 -- 个 惟 
一 的 物理 地 址 《physical address，PA)。 第 一 个 字 节 的 地 址 为 G6， 接 下 来 的 字 节 地 址 为 1， 再 下 一 个 
为 2， 依 此 类 推 ， 给 定 这 种 简单 的 结构 ，CPU 访问 存 赃 器 的 最 目 然 的 方式 束 是 使 用 物理 地 址 。 我 们 
把 这 种 方式 称 为 物理 村 址 Cphysical addressing). Ё 10.1 展示 了 一 个 物理 寻 址 的 术 倒 ， 访 水 例 的 上 
下 文 是 一 条 加载 指 令 ， 读 取 从 物理 也 址 4 处 开始 的 字 。 





10.1 一 个 使 用 物理 寻 址 的 系统 


当 CPU 执行 这 条 加 载 指 令 时 , 它 会 生成 一 个 有 效 的 物理 地 址 ， 道 过 存储 器 总 线 ， 把 它 传递 给 主 
ff. 永存 取出 从 物理 地 址 4 处 开始 的 4 字 节 的 字 ， 并 将 它 返 回 给 СРО, CPU 会 将 生存 放 在 一 个 襟 存 
RH. 

时 期 的 PC ADE JH fu LS dS АЕ. HOA GLASS SEDE, Сау 超级 计算 机 这 
ES ЖЖ Ж AE GE [B Pk ph BE GN. ЖШ, АНТ Я БРИ КИЕЛІ ЗЕ Ж d АЕ 
( virtual addressing), МЕ 10.2. 


іе 





ч о оь оо 9 — = 


fier 
图 102 一 个 使 用 虚拟 寻 址 的 系统 


594 X 10* 

ЖЕНЕ ЗІ, CPU iB 1f EHE dA BE Cvirtual address, УА) ЖИИ Efe. iR bt hi 
{ЕЖЕ SEE RE RE 2 WI o REG di PO RE hak. НЕТУ dEHIEU BEES PR 89 RI Gb RE E E ШИ и, di 
ЯҒ (address translation). GEB ЬЬ — NE CPU {ТЖЕ REL pn e E. 
CPU i Emi MMU (memory management unit, ШЕР) HRR, HAFREN 
ЙЕ RER. RAER, 


102 地址 室 间 


EEM] (address space) Ж—1 {ИЛ HC Hb DD HET s, 

|0. I, 2, “| 

in ЖАНЕ Н p EM ЖЕНЕ, 02 RECTE IE TAHT] Clinear address space ). 
ЖГЕНЕНІПІНІІНЕ, STA РГЕН ЖЕНЕКЕ КЕҢЕЙ. Е АРТИ ДЕК ЖЮ, CPU 
时 一 个 有 NeT “ӨЗЕНІНІҢ dh КЕЙ ЖИЕ, А T Hh H| [Н] Fr y Ж do БЕ E 8] (virtual address 
space h: 

(0, 1, 2, =, М-1). 

ИШЕН АМИН d or Rc b p E ЕЕЕ ЕЙ. 例如 , 一 TB AT “F Hh hk IS 
МЕЗО ЗЕ ШШ —4+= л {Уу КЕШЕН]. ЖК ЕВ HH M 32 位 或 者 64 КОЙШАН SS. 

=> — Th BER 3k E H] (physical address space)， 它 与 系统 中 物理 存储 器 的 村 个 宇 节 
相对 应， 

[0. 1, 2, =, M-1). 

М АЛЕ 20. Е ТОЕ ТНР, MUMA ме”, 

BEST ІНЕ, САС ТА CET HIE PE CHE. 
“НІН TIMES. ЖАШПЫ EE, 光 许 每 个 数据 对 瘟 有 名 个 独立 的 地 址 ， 凑 
中 每 个 地 址 都 选 自 一 个 不 同 的 她 址 空间 ， 这 就 是 虚拟 在 铺 跟 的 基本 思想 。 主 存 中 的 每 字 世 起 有 一 个 
HAERA НЕ З [н] И ДР, ЖП Е ПН НЕНЕН Ж НІҢ. 

Жыш 10.1 

Am TF R А. AERA BH. FLAME SHEERA AHP. ИТЕН, қ-а" 


(АІ M=2” (4k, WZ) баз" (ҒА, Fig) Те (Zin). Pa2" (FFR), Ea" 
[+k |, 


ТҮТТҮ" (n) кешік UNI | Езген el 
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103 ”虚拟 存储 器 作为 缓存 的 工具 


概念 上 而 言 ， 虚 拟 存储 器 〈《VM) 被 组 织 为 一 个 由 存放 在 磁盘 上 的 点 个 连续 的 字 节 大 小 的 单元 
组 成 的 数组 。 每 字 节 都 有 一 个 惟一 的 虚拟 地 址 ， 这 个 惟一 的 趾 拟 地 址 是 作为 到 数组 的 索引 的 。 磁 查 
上 数组 的 和 内容 窟 组 存在 主 存 中 。 和 存储 器 层次 结构 中 其 他 缓存 一 样 ， 磁 盘 〔〈 较 低层 ) 上 的 数据 被 分 
БІНЕ, ЗАЛЫМЕН ЕТ СОҢЫ) 之 间 的 传输 单元 ，VM 系统 通过 将 虚拟 存储 器 分 割 为 称 
ARIWA (virtual page. VP) 的 大 小 固定 的 块 ， 来 处 理 这 个 问题 。 每 个 虚拟 页 的 大 小 为 Pr EY. 
类 羽 地 , 物理 存储 器 被 分 割 为 物理 页 Cphysical page, РР), ADEA PZY (物理 页 也 被 称 为 页 帧 ， 
page frame). 

ТЕН, ЖЕЛИШ Ge te НІНЕ: 

. ЖӘН: VM 系统 还 未 分 配 【 或 者 创建 ) 的 页 。 术 分 本 的 块 没有 任何 数据 和 它们 相关 联 ， 

因此 也 就 不 户 用 任何 磁盘 空间 ， 

. 禾 存 的 ， 当 前 缓存 在 物理 存储 器 中 的 已 分 配 页 。 

. 未 绥 存 的 ， 没 有 组 存在 物理 存 铺 器 中 的 已 分 配 页 。 

图 10.3 МЖ Г МА ЕМЛЕ. ЖАН 0-3 还 没有 被 分 配 ， 因 此 在 
磁盘 上 还 不 存在。 虚拟 页 1、4 和 5 被 缓存 在 物理 存储 器 中 。 页 2、5 和 77 己 经 被 分 配 了 ， 但 是 当前 
并 未 缓存 在 主 存 中 ， 





m ЖЕ DAAM 中 
каа cn dde 


10.3 一 个 虚拟 存储 器 系统 是 如 但 使 用 主 存 作 为 缓存 的 


1051 DRAM 高 速 缓存 的 组 织 结构 

为 了 帮助 我 们 请 果 理 解 存储 层次 结构 中 不 同 的 缓存 概念 , 我 们 将 使 用 术语 SAM ЖЕЖ 
于 CPU 和 主 存 之 间 的 L1 和 2 高 速 缓 在， 并且 用 术语 DRAM 组 在 来 才 示 叭 拟 存储 器 系统 的 缓存 ， 
它 在 主 存 中 缓存 虚拟 页 。 

在 存储 层次 结构 中 ，DRAM 饶 丰 的 位 置 对 它 的 组 织 结构 有 很 大 的 影响 。 回 想 一 下 : DRAM E 
SRAM HB X ZJ 10 16, ШИЙ ЕН. DRAM RAH 100 000 多 倍 。 因 此 ,DRAM 缓存 中 的 不 命中 Lmiss) 
比 起 SRAM 缓存 中 的 不 谷中 要 昂贵 得 和 多， 因为 DRAM 缓存 不 命中 型 由 磁盘 来 服务 ， 而 SRAM 缓存 
不 命中 通常 是 由 基于 DRAM 的 主 存 来 服务 的 。 ПІН, 从 磁盘 的 一 个 遍 区 读 取 第 一 字 节 的 时 间 开销 比 
起 读 这 个 司 区 中 后 面 的 字 节 要 慢 大 约 10000018. IE 1, DRAM 缓存 的 组 织 结构 完全 是 由 巨大 
的 不 命中 开销 驱动 的 。 
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HAKATA ETAWA YJ, БИІНЕН ЕЧ АС, АЛАШ 4—8KB. BT X 
Heihi. DRAM ЕЛЕНЕ, WAER. ЕНЕ ТЫН ЖҮГІНЕ, + 
ШЕ ИНЕ НЕКЕ ПЕ, НОБЕЛ ИТІ. Elit, EEH SRAM i 
ir. BTE REM DRAM HE (E680 Т И SOME DEM HARTE Coe Hae ic Tm e G H), 
itis. [ЕЛНИ ТШШН ИШК. DRAM {ЕШ Н ЗІН (wric-back), if E É YJ 
Cwrite-through ).. 


10.32 m 

HERRA. ЕГ ЖИК БИЛЕН УЫ ЖИ — + NTR R S DRAM 中 的 某 
THET. ШЕШ, mp Datuk RR Fk AW T o e Ep. ШЕЛІ, ЖШН 
T BHO dif КЕИ ЧҮК. CARTA РИФ THREE. ЕЕЗ ЕА ЕЕЕ П 
DRAM rp, МИЛЯ, 

iere d nod EASIER. fh. BES KOK. MMU ЕЕЕ RO 中 的 地 
ІНЕН, ЖІ ЧЕН Н A. Cpage table). POSER KJ. ЖЖ dri E RUE RO 
ИНД. КИШЕР ЕЕ — T REL E JU ТНА Pi. ЖЕШ KA. W KES D Nil 
WP. EL RZESESE DRAM (ЖШ, 

Н 104 展示 了 一 个 页 表 的 基本 组 织 辕 构 。 页 表 就 是 一 个 PTE (page table entry, MASHY 的 
数组 ， 砌 报 地 址 空间 中 的 每 个 页 在 页 表 中 的 一 个 图 定 情 称 量 处 虱 有 一 个 PTE。 为 了 我 们 的 日 的 ， 我 
MARRET PTE Ji i — 2. (valid bity 和 一 个 于 位 地 址 字 据 组 万 的 。 有 将 位 表明 了 访 虚 握 
h^ E SNO EDRAM'P. WERE THX. NA MEER SEE DRAM 中 相应 的 物理 页 
fot. G haqa T UL. In HE FCR. Ed; АНЕ u ma 
қажы. TOM. ix aO US a AR Ed E b E. 

киши EIL: 









ЖЕЗ ~ 
(БАМ) 


图 104 mA 


图 10.4 中 的 示例 展示 了 一 个 有 昌 个 玲 搜 页 和 4 1- ЖИИ ЖЕЕП. ШЕ ЦИ CV. VP. 
YP4 КІ ҰРТ» ИЕНІ DRAM 中 ， 两 个 页 【WPD ҰР) Зе, ПЕШІ (VP3 和 
YP6) DEREN BESIER. B 10.4 中 有 一 个 要 点 要 社 意 ， 因 为 DRAM ST R + 
四 联 的 ， 尾 意 物 理 页 都 可 以 世 党 尾 意 虚拟 页 。 
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5 10.2 
МАСАНЫ А (п) 和 页 大 小 (PP) 的 组 会 所 需要 的 РТЕЖЖ: 





10.3.3 页 命中 

考虑 - POR CPU ЖЫЛАНЫ АҒЫ, ЕЖУР 包含 且 被 缓存 在 DRAM 中 ， 会 发 生 什 么 
(参见 图 10.5)。 使 用 我 们 将 在 10.6 АГРА ЖЕЖ. ЖАНЫН ТЕН E EEA -i 
索引 ， 来 定位 PTE2， 并 从 存储 器 中 读 孔 它 。 始 然 设 置 了 有 效 位 ， 那 么 地 址 翻译 硬件 就 知道 YP2 是 
缓存 在 存储 器 中 的 ВТЕ PTE 中 的 物理 存储 器 地 址 (该 地 址 指向 PP0 中 缓存 页 的 起 始 位 置 )， 
构造 出 这 个 字 的 物理 地 址 。 


BRUN 物理 句号 或 者 物理 存储 器 【DRAM ) 
ЫИ 
Lc Wm РРО 


РТЕ 01. nt p? 








ur ыра 
Ы [МР3 | 
ШШ d (ORAM) | mu УРАН | 
| Vee | 
97 | 

Ж 105 YM 页 命中 


对 WP2 中 -个 字 的 引用 就 命中 了 。 


10.34 т 

ТЕЙЯР RAAF, DRAM READ BOUE Я (page fault), В 10.6 ARTERI 
BEATAE KERRE. CPU 引用 了 МРЗ 中 的 一 个 字 ， 这 个 字 并 未 缓存 在 DRAM T. ЖАН 
译 蚀 件 从 存储 器 中 读 取 PTE3， 从 有 效 位 推断 出 VP3 未 被 缓存 ， 并 且 触 发 - -个 缺 页 异常 。 

斌 页 异常 调用 内 核 中 的 缺 页 异常 处 型 程序 , 该 程序 会 选择 - -个 牺牲 页 , 在 此 例 中 就 是 存放 在 PP3 
HAI УРА. Ж УРА СЕ, MARRAS EE ТІҢ ШОН. ЖОЯМЫН, НЕШЕ 
VPA 的 页 者 条 日 ， 反 映 出 VP4 不 再 缓存 在 主 存 中 这 一 上 事实 。 

ЖЖ. ARARE YP3 到 存储 器 中 的 PP3， 更 新 PTE3， 随 后 返回 。 当 异常 处 理 程 序 返 
图 的 ， 它 会 重新 局 动 寻 致 缺 页 的 指令 ， 该 指令 会 把 导致 缺 页 的 虚拟 地 赴 重 发 送 到 地 址 翻译 硒 件 。 但 
是 现在 , МРЗ 已 经 缓存 在 主 存 中 了 , 那么 页 命中 也 能 由 地 址 翻译 硬件 正常 处 理 了 , Ж@ БЕШ 105 


600 | ATA 





中 看 到 的 那样 ， 图 10.7 展示 了 在 缺 页 之 后 我 们 的 示例 页 表 的 状态 ， 


„ШЕЛ жаки Wa mum DRAM) 
一 一 еш — 
ЖЕЛІС | Pro 
РТЕ 070 м 
: ER. 84 РРЗ 






ghmne it 


| ™ 7 [ МР; | 
ныш N = Es | 


T үрк | 
LB EIL | 
图 10.6 VM ERR 【之 前 ) 
对 YP3 PARTEJAT: Unix TOL. 


munt mmnuda 9H iH DRAM) 





ibam “ wI Ww | 
i DRAM} “| WPi | 





BEI Ум (25) 
VCLIERERUE Е ум AAEN, PARS ЕН ур ТИПП: tE, ERTUEREUEIEK I SEHE LEHRER С. ER 
ТРН ЕЖЕТ. ШЕ” R И. 


GM E 20 世纪 60 ЕЕ ЕН. ШЕ CPU-TER BE E] E REL a| = tE 
SRAM {Р 2 8p. БК, БЫНЫ ЖИЕН T ВАМ 缓存 不 同 的 术语 ， ШЕПТЕ EW 
RN. ЕНИН ЕТ fud. ЕЖЕЛ, EERME I EON Eam Ё 
ë (swapping) 或 者 页 面 调度 (paging). TL AREA. (ШЖ E C DRAM， 和 从 DRAM š 
出 到 【或 者 页 面 调 出 到 ) WS. АЭН, ИШЕНИ, ВӘ SO FG REEM, ЯМАН 
面 的 这 种 策 栈 被 称 为 护 需 页 面 调度 《demand paging). КЕ ЖЕЕ Raj 880, шенінің 
Аны ыы ыы ыы 


虚拟 存 情 路 601 


10.35 ”分配 页 面 

图 10.8 展示 了 当 操作 系统 分 配 一 个 新 前 虚拟 存储 器 页 时 ， 对 我 们 示例 页 表 的 影响 ， 例 如 ， 调 用 
malloc 的 结果 。 在 这 个 示例 中 ,通过 在 磁盘 上 创建 空间 ， 并 更 新 PTE5， 使 它 指向 磁盘 上 这 个 新 创建 
的 页 面 ， 从 而 分 配 VP5。 


物理 页 号 或 者 
ЖАНН HAF (ОНАМ) 








кән РЗ 
(DRAM) "oa ARA. Li 








4108 ”分配 一 个 新 的 虚拟 页 面 
ЧЕТА БОЮ YPS, HHH РТЕ5 指向 这 个 新 的 位 置 。 


10.3.6 局 部 性 再 次 搭救 

当 我 们 中 的 许多 人 部 了 解 了 虚拟 存 情 器 的 概念 之 后 ， 我 们 的 第 一 印象 通常 是 它 的 效率 想必 是 非 
党 低 。 和 假设 不 俞 中 处 搓 很 大 ， 我 们 会 担心 页 面 调度 会 破坏 程序 性 能 。 实 际 上 ， 吕 拟 存 储 器 上 作 得 相 
当 好 ， 这 主要 归功 于 我 们 的 老 朋 友 局 部 性 locality)。 

尽管 在 整个 运行 过 程 中 程序 引用 的 不 同 页 面 的 总 数 可 能 超出 物理 存储 器 总 的 大 小 ， 但 是 局 部 性 原 
则 保证 了 在 任意 时 刻 ， 这 些 责 面 将 趋 问 于 在 一 个 较 小 的 活动 页 面 【active page) 集合 上 工作 ， 这 个 集 
台 叫 艇 工作 集 (working set) 或 者 常 驻 集合 (resident sety。 在 初始 开销 ， 也 就 是 将 工作 集 页 面 调度 到 
存储 器 中 ， 之 后 ， 接 下 来 对 这 个 工作 集 的 引用 将 导致 命中 ， 而 不 会 产生 额外 的 磁盘 流量 。 

只 要 我 们 的 程序 有 好 的 时 间 局 部 性 ， 哄 所 存储 器 系统 就 能 工作 得 相当 好 。 查 是 ， 当 然 ， 不 是 
所 有 的 程序 都 能 展现 良好 的 时 间 局 部 性 。 如 果 开 作 集 的 大 小 超出 了 物理 存储 器 的 大 小 ， 那 么 程序 
将 产生 一 种 不 许 的 状态 ， 叫 极 颠 医 〈thrashing )， 这 时 页 面 将 不 断 地 换 进 换 出 。 虽 然 虚 氢 存储 器 通 
党 是 有 效 的， 但 是 如 果 一 个 程序 性 能 慢 得 像 腿 一 样 ， 那 么 赠 明 的 程序 员 会 考虑 看 是 不 是 发 生 了 医 
B. 


ай, ЖАЛАКЫ 
ATAPI Unix 的 getrusage dde bx e nde (AAHS KX k,k6-k s). 


10.4 ”虚拟 存储 器 作为 存储 器 管理 的 工具 
在 上 一 节 中 , 我们 看 到 盛 拟 存 储 器 是 如 向 提供 一 种 机 制 , 利用 DRAM 来 缓存 来 自 通 常 更 大 的 虚 
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拟 地 址 室 间 的 页面 ， 有 趣 地 是 ， 一 些 早期 的 系统 ， 比 如 DEC PDP-11/70, Ert НЕЕ TA 
器 更 小 的 卓 所 地 址 空间 。 配 而 ， 旧 所 地 址 仍 撮 是 一 个 有 用 的 机 制 ， 因 为 它 大 大地 简化 了 存储 器 管理 ， 
并 提供 了 一 种 简单 自 烽 的 保护 存 赌 回 的 方法 。 

到 日 痢 为 止 。 我 们 才 假 访 有 一 个 单 名 的 页 表 ， 将 一 十 虚 执 地 址 空间 映射 到 物 球 地址 补 间 。 实 
际 上 , ЕЕ ЛЕ РАЧА ЦА Г нен, Df do RE T8 or f] dL b Sin]. 图 10,9 
Жр ГА. ТЕГЕ, ЗЕТЕ т 的 页 囊 将 ҮРІ 映射 到 РР2, VP2 М ЕРТ. НШІ, 
进程 | ПШ ЖЕ VPI 到 PP7，YP2 РЕ BJ PPIO. 福 意 ， 吉 中 虚拟 页面 可 以 上 逐 射 到 同一 钻 共享 物 现 
页 面 上 。 


gx esp n ü= 


ER i 


Р? |: 





ШО? ум 如何 为 进程 提 殿 独立 的 地 址 空间 
WIESEN ЖЕРЕН КИТЕ. 


ЖЕ ИШАН ЖЕ ST] HE ELI AEST] (ЕЁ SEP ipta ШЕНЕНІННЕНЕІ Т ЖЫН. 
Ws. vM 葡 化 了 链接 和 加 却 ， 共 享 代码 和 数 狂 ， 以 及 对 应 用 分 本 存储 器 。 


1041 简化 链接 

独立 的 地 址 空间 党 许 释 个 进程 为 它 的 存储 器 映像 眉 用 相同 的 基本 格式 ， 而 不管 代码 和 数据 实际 
НЕНІ ІНЕ, ІП, Ei Lin ЖЕ ИЕН 10.10 所 示 的 格 武 。 

文本 区 总 是 内 虚报 地 址 0xD0B80d48000 КБ. М ЖН Oxbfffffff ЕНИ. OHIO 
是 从 地 域 Ox4000000 姓 开始 ， 而 操作 系统 吕 码 和 数据 总 是 具 地 址 0xe0000000 开始 ， 这 样 的 一 下 性 
极 友 地 简化 了 链接 器 的 设计 和 实现 ， 区 许 链接 器 生成 全 链接 的 可 执行 文件 ， 这 些 可 执行 亦 件 是 御 立 
于 物理 存储 器 中 代码 和 数据 的 最 毕 位 置 的 ， 


1042 简化 共享 

强 立 地 址 空间 为 挤 几 系 诸 提供 了 一 个 管 理 疼 户 进程 和 操作 系 嵌 自身 之 闻 挫 享 的 一 臻 机制。 一般 
而 言 ， 短 个 进程 者 有 自己 闲 有 的 忧 码 、 数 据 。 堆 以 及 槛 区 域 ， 是 不 和 其 他 进 释 共享 徇 。 在 这 种 情况 
中 ， 痢 必 系 统 创 建 页 表 ， 将 相应 的 虚 氢 页 上 映射 到 再 同 的 物理 页 面 ， 

柑 南 ， 在 一 些 情况 中 ， 还 是 需要 进程 来 共享 化 大 和 数据 。 恒 如 ， 每 个 进 和 必 业 调用 相同 的 操作 
ЖКН НЩ. ШТ C 程序 帮会 调用 标 淮 库 中 的 程序 ， 比 如 piai. МЕИ ЕЕ 
后 当 的 虚拟 页 曾 卡 射 各 相同 的 物理 页 面 ， 从 而 次 振 审 个 进程 共享 这 部 分 人 到 的 一 个 拷 四， 面 不 是 在 
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# En eer ds PARIS ACRI C 标准 库 的 拷贝 


| 用 户 栈 
‘在 运行 时 创建 》 
JR PERS FEE Яр 


ТІҢ 
:运行 时 由 malloc 创建 》 
ж,ыр 
(C data, .bss) 
HER 
(.init. .rext. .rodata? 


未 用 的 





| mp RET 
可 见 的 存储 器 









Dxeñn 30 0600 





4— teap IBS 


DE EADE E inini 


rE 







Мат 






aGxOE04B5n0z 


к 


10.10 一 个 Linux ЖЕ Zr O6 s SS 
程序 总 是 从 虚拟 邮 址 0x8043000 kt FE Ri. БІР R A e Ha Hl OxbfffíFif 处 开始 ,共享 对 象 总 是 加 载 在 从 虚拟 地 址 0х40000000 
处 开始 的 区 域内 ， 


1043 简化 存储 器 分 配 

虚拟 存 赃 器 为 同月 户 进 程 提供 一 个 简单 的 分 配额 外 存储 器 的 机 制 。 当 -个 运行 在 用 户 进程 中 的 
程序 要 求 额 外 的 扒 空间 时 〔 例 如 ， 调 用 mallo 的 结果 )， 操 作 系统 分 配 一 个 适当 数字 (例如) 个 连 
续 的 虚拟 存储 器 负面 ， 并 上 且 将 它们 映射 居 物 型 存储器 中 任意 位 置 的 k 个 任意 的 物理 页 面 。 由 于 页 表 


工作 的 方式 ， 操 作 系统 没有 必要 分 配 k 个 连续 的 物理 存储 器 页 面 。 页 面 可 以 随机 地 分 散在 物理 存储 
器 中 。 


10.4.4 简化 加 载 

虚拟 存储 器 也 使 却 载 可 执行 文件 和 已 共享 日 标 文件 到 存储 器 中 变 得 容易 。 阿 想 一 下，ELF ор 
行文 件 中 的 .text 和 ,data 节 是 相 邻 的 。 为 了 加 载 这 些 节 到 一 个 新 创建 的 进程 中 ，Linux 加 载 程序 分 配 
了 一 个 从 地 址 0х08048000 处 开始 的 连续 的 虚拟 贡 面 区 域 , 将 它们 标识 为 无 效 的 (也 就 是 未 缓存 的 )， 
并 将 它 科 的 页 表 条 日 指向 目标 文件 中 适当 的 位 置 ， 

有 有趣 的 -点 是 如 载 器 从 不 真正 地 从 磁 稚 中 找 只 任何 数据 到 存储 器 中 。 当 每 个 页 面 第 一 次 被 引用 
时 ,虚拟 和 存储 跟 系 统 将 日 动 并 按 需 地 把 数据 从 磺 盘 工 调 入 到 存储 器 , 页面 引用 或 者 是 当 CPU 取 一 条 
指令 时 ， 或 者 是 当 一 条 正在 执行 的 指令 引用 一 个 存储 器 位 置 时 。 

映射 一 个 连续 虚拟 页 面 的 集合 到 和 企 意 一 个 文件 中 的 任意 一 个 个 置 的 概念 叫 和 你 存储 器 映射 
(memory mapping). Unix PE J "АЧИ ттар 的 系统 调用 ， 允 许 皮 用 程序 进行 自己 的 存储 器 映 
射 。 我 们 将 在 10.8 ФЕ ЯНА АРЫН. 
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10.5 虚拟 存储 器 作为 存储 器 保护 的 工具 


性 何 现代 计算 机 系统 必须 尺 操 作 系统 提 供 皇 段 来 控制 对 存储 器 系统 的 访问 。 不 应 该 允许 -个 用 
户 进 程 修改 它 的 只 读 文 本 段 ， 而 且 也 不 应 该 允许 它 读 或 修改 任何 内 核 中 的 代码 和 数据 结构 。 不 应 该 
允许 它 读 或 者 写 其 他 进程 的 私有 存储 器 ， 并 且 不 允许 它 修 改 任何 与 其 他 进程 共享 的 虚拟 页 面 ， 除 非 
所 有 的 共享 者 都 显 式 地 允许 它 这 么 做 (通过 调用 明确 的 进程 间 通 信 系统 调用 )， 

威 像 我 们 所 看 到 的 ， 提 供 狂 立 的 她 和 直 空 间 使 得 分 离 不 同 进程 的 私有 存储 器 变 得 容易 。 但 是 ， 地 
址 翻译 机 制 可 以 以 一 种 自然 的 方式 扩展 到 提供 更 好 的 访问 控制 。 因为 每 次 CPU 生成 一 个 地 址 寺 , 地 
址 翻 详 媒 忻 都 会 读 个 PTE, 所 以 通过 在 PTE 上 添加 一 些 额外 的 许可 位 来 控制 对 一 个 虚拟 页 茄 内 容 
的 访问 ， 十 分 简单 ， 图 10.11 展示 了 一 般 的 概念 ， 


带 许 可 人世 的 页 表 
SUP READ WRITE ”地 起 


——— 








ҰР0:)| No Yes | No | PPS 
进程 i МР1: No Yes | Yes | PP4 <— 
VP2: Yes Yes Yes | РР2 


p 





SUP READWRITE НІ 


2 
уре: No | Yes; Мо | PP9 .——— —— 


HEEL урт. | Yes Yes | Yes PP Б 
VP2.| No | Yes | Yes PP 11 * 十 一 一 一 


ТО 用 点 拟 存 储 器 米 提 供 页 面 级 的 存储 器 保护 


在 这 个 示例 中 ， 我 们 已 经 添加 了 三 个 许可 位 到 每 个 PTE, SUP 位 表示 进程 是 否 必 须 运 行 在 内 核 
(超级 用 户 》 江 式 下 才能 访问 该 册 。 运 行 在 内 核 模 式 中 的 进程 可 以 访问 任何 页 面 ， 但 是 运行 在 用 户 
模式 中 的 进程 只 允许 访问 大 些 SUP 为 0 的 页 面 。READ 位 和 WRITE 位 控制 对 正面 的 读 和 写 访问 。 
Ма, WEAR i 运行 在 用 户 模式 下 ， 那 么 它 有 该 УРО ЖЕҢ VP 的 权限 。 然 而 ,不 允许 它 访问 
VP2. 

WR- -条 带 令 违反 这 些许 可 条 件 , 那么 CPU 就 触发 -个 REPRE, 净 控 制 传递 给 - -个 内 
FERALE. Unix shell 典型 地 将 这 种 异常 报告 为 “ 段 错误 (segmentation fault)”, 





10.6 地址 翻译 


这 一 节 讲 述 的 足 地 址 翻 详 的 基础 知识 。 我 们 的 且 标 是 让 你 对 硬件 在 支持 虚拟 存储 器 中 的 角 双 有 
正确 的 详 价 ， 并 给 你 和 是 够 多 的 细节 使 得 你 可 以 亲手 演示 一 些 具 体 的 示例 。 不 过 ， 要 记 住 我 们 省 略 了 
大 量 的 细 六 ， 尤 其 是 和 时 钟 相 关 的 细节 ， 昌 然 这些 细 节 对 便 件 设计 者 来 说 是 非常 重要 的 ， 但 基 超 出 
了 我 们 讨论 的 范围 ， 图 10.12 ТЕГИ ЕН ЕТЕНЕ, ЕЖ, 

地 址 郁 译 是 一 个 六 元 素 的 虚拟 地 址 空间 (VAS) "PESO ERIT S 好 元 素 的 物理 地 址 空间 (PAS) 
中 元 素 之 间 的 映射 
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MAP:VAS—PASU 0 

这 里 

MAP (A) =А' TIR dU BE А 处 的 数据 在 PAS 的 物理 也 址 A 处 。 

= ОЖИНА 处 的 数据 不 在 物理 存 赃 器 中 

图 10.13 展示 了 MMU 是 如 何 利用 页 表 来 实现 这 种 映射 的 。CPU 中 的 一 个 控制 寄存 器 ， 页 表 基 
HFAB (page table base register, PTBR) 指向 当前 页 表 。n 位 的 虚报 地 址 包含 两 个 部 分 ， — p 
位 的 VPO (virtual page offset, 虚拟 页 面 偏 移 ) 和 一 个 (пер) 位 的 VPN (virtual page number, 虚拟 
KF). MMU 利用 VPN 来 选择 适当 的 PTE, 例如 ，VPN0 选择 PTE0, VPN1 选择 PTE1, 以 此 类 推 。 
将 页 表 条 日 中 PPN (physical page number, WEAF) 和 虚拟 地 址 中 的 УРО RREK, RAS EUR 
的 物理 地 址 。 注意 ， 因 为 物理 和 虚拟 页 面 都 是 下 字 节 的 ， 所 以 PPO (physical page offset, МЕЛ 
ҺА) 和 УРО 是 相同 的 。 

















N =?" Ti SOLER or = [Н] p Eu LE 
物理 地 址 宰 间 中 的 地 址 数量 


жы 
页 的 大 小 ( 字 节 ) 





Han 
图 10.12 HR EAS 
图 10.14 (a) 展示 了 当 出 现 页 面 命中 时 ，CPU АТЕВ. 
. 第 一 步 : 处 理 器 生成 一 个 虚拟 地 址 ， 并 把 它 传送 给 MMU. 
ө 第 二 步 ，MMU 生成 PTE 地 址 ， 并 从 高 速 缓存 / 主 存 请 求 得 到 它 。 
e #=+%. ЖЕЙТ Н MMU 返回 PTE, 
e V; MMU 构造 物理 地 址 ， 并 把 它 传送 给 高 速 缓存 / 主 存 。 
e E Ed: 高 速 媛 存 / 主 看 返 回 所 请 求 的 数据 字 给 处 理 器 。 
和 页 面 命中 不 同 的 是 ， 页 面 命中 完全 是 出 硬件 来 处 理 的 ， 而 处 理 缺 页 要 求 硬件 和 操作 系统 内 核 


I 
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协作 完成 ， 如 类 10.14 (5). 


МЕНІ 
п-1 рг-1 0 
虚拟 页 号 (YPN) HEEL RE R СУРО) 














ub gus (PPN) 


HEF 


如 困 有 效 位 = 0 
ЖТ 1 & 
fm (ЖП) 


物理 地 址 
图 10.13 使 用 页 表 的 地 址 翻译 








(b) & o 


图 10.14 ram tp RO LBS BERT A 
VA: ШІ; РТЕА: 奥 表 条 日 地 址 ，PTE: AEZH: РА, ШЕЛ. 
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* 第 一 步 到 第 三 步 ， 和 图 10.14 GO 中 的 第 一 步 到 第 三 步 相同， 

e фт: PTE 中 的 有 效 位 是 零 ， 所 以 MMU 触发 了 一 次 异常 ， 传 递 CPU 中 的 控制 到 操作 系 
统 内 核 中 的 馈 页 异常 处 理 程 序 。 

e 第 五 步 : 缺 页 处 理 程序 确定 出 物理 存储 器 中 的 牺牲 页 ， 如 果 这 个 页 面 已 经 被 修改 了 ， 则 把 
它 页 面 换 出 到 磁盘 。 

e ЖАЗУ. 缺 页 处 理 程 页 面 调 入 新 的 页 面 ， 并 更 新 存储 器 中 的 PTE, 

. 第 七 步 : 缺 页 处 理 程 序 返回 到 原来 的 进程 ， 驱 使 导致 缺 页 的 指令 重新 启动 。CPU 将 引起 缺 
页 的 指令 重新 发 送 纵 MMU。 因 为 虚拟 页 面 现在 缓存 在 物理 存储 器 中 ， 所 以 就 会 命中 ， 在 
MMU 执行 了 图 10.14《〈b) 中 的 步骤 之 后 ， 主 存 就 会 将 所 请 或 宝 返 回 给 处 理 器 。 


5110,3 
给 定 一 个 32 位 的 虚拟 地 址 空间 和 一 个 24 [o EAE RE, SEDET AE LR K ol P. # z VEN. 
VPO. PPN 和 PPO éd. 





10.6.1 结合 高 速 缓存 和 虚拟 存储 器 

在 任何 既 使 用 虚拟 存 鱼 器 又 使 用 SRAM 缓存 的 系统 中 , ЗА ЕЕ НЕНЬ RE FR P ph 
址 来 访问 高 速 缓存 的 问题 尽管 关 于 这 个 折 中 网 详细 讨论 已 经 超出 了 我 们 的 讨论 范围 ， 但 是 大 包 数 
系统 是 选择 物理 寻 址 的 。 使 用 物理 寻 址 ， 多 个 进程 竣 时 在 高 速 疆 存 中 有 看 屠 块 和 共享 来 自 相同 点 拟 
页 面 的 块 成 为 很 简单 的 事情 。 而 且 ， 高 速 缓存 无 需 处 理 保护 问题 ， 因 为 访问 权限 的 检查 是 地 址 竹 译 
过 程 的 -部 分 。 

图 1015 展示 了 一 个 物理 寻 址 的 高 速 稻 存 如 何 和 虚拟 存 情 器 结合 让 来。 主要 的 思路 是 地 址 翻译 
发 生 在 高 速 缓存 查找 之 前 。 注 意 页 表 条 日 可 以 缓存 ， 就 像 其 他 的 数据 字 一 样 ， 


A448RRLIL sam----- іфа-..-кь -ainr---iriaa--iaaaiiuasinaaaiaaaLL -aaalc---iItii---iu--- 一 rs 


数据 [1 
ЕЖЕН 


81015 将 虚拟 存 贱 器 与 一 个 物理 寻 址 的 高 速 缓存 结合 起 来 
МА: ЖИЫНЫ; PTEA: Д4 Aiia: PTE: HH: РА: ЯНЬ, 
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1062 利用 TLB Jm b HE E € 

正如 我 们 看 到 的 ， 每 次 CPU 产生 一 个 虚 氛 地 址 ，MMU 就 必须 查阅 -个 PTE， 以 便 将 虚 氛 地址 
MESHARI. FERRERA 卜 ， 这 会 要 求 一 次 对 存储 器 的 额外 的 取 数 帮 ， 代 昼 是 儿 十 到 几 百 
个 周期 。 如 果 PTE ТУЖ {РЕ Ll 中 ， 那 么 开销 就 下 降 到 1 个 或 2 个 周期 。 然 而 ， 许 多 系统 都 试图 
消除 中 使 屁 这 样 的 并 销 ， 它 们 在 MMU 中 包括 了 一 个 关于 PTE 的 小 的 缓存 ， 称 为 TLB (translation 
lookaside buffer, $$ 5 8-34 ЖЫ). 

TLE &— «B. БЕЗІНЕН, Е-Е н ET PTE 组 成 的 块 。TLB 38 
HARRERA. ШІН 10.16 所 示 ， 用 于 组 选择 和 行 匹 配 的 索引 和 标记 字段 是 从 虚拟 地 址 中 的 虐 
JURO. dp TLE 有 T=2' 个 组 ， 那 么 TLB ЖІ (ТІРІ) 是 由 VPN 的 1 个 最 低位 得 
成 的 ， 而 TLB Hie СТІБТ) 是 由 VPN 中 剩余 的 位 组 成 的 ， 


n-1 2+1 p+t-i pp 1 0 


TLB 标 记 (TLBT) | TLB 索引 (TLBI) 


OC 
VPN 


图 10.16. 一 个 用 来 访问 ТВ 的 虚拟 地 址 的 组 成 部 分 


图 10.17 (a) 展示 了 当 TLB 命中 时 (通常 情 枫 } 所 包括 的 步骤 。 这 里 的 关键 点 是 ， 所 有 的 地 址 
ТЕЛ ДЕ: MMU 上 执行 的 ， 因 此 非常 快 。 

в 第 一 步 : CPU >: МАЕ 

e ote ZJ. ММО M TLB 中 取出 相应 的 PTE. 

. 第 四 步 ，MMU АЕ ННВ A, ЕВРЕ НИЕ. 

. ЖАЎ. ВИТЕ eY PH u ЖП z E А CPU. 

Aj TLE 不 命中 时 ，MMU 必须 从 Ll 缓存 中 取出 相应 的 PTE, ШЕ 10.17 (b) 所 示 。 新 取出 的 
PTE 存放 在 TLB 中 ， 可 能 会 覆盖 一 个 已 经 存在 的 条 目 。 





(a) ТІҢ 前 中 
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(b) TLE 不 命中 
图 10.17 TLB 命中 和 不 命中 的 操作 视图 


10.5.8 ZANE 

到 目前 为 止 ， 我 们 一 直 假 设 系 统 只 用 一 个 单独 的 页 表 来 进行 地 址 翻 洗 , 但 是 如 果 我 们 有 一 个 32 
位 的 地 址 空间 、4KB 的 页 面 和 一 个 4 字 节 的 PTE， 那 么 我 们 总 是 需要 一 个 4MB 药 页 表 些 留 在 仓储 
器 中 ,即使 应 用 所 引用 的 上 只 是 虚拟 地 址 空间 中 很 小 的 一 部 分 。 对 于 地 址 空间 为 64 位 的 系统 来 说 ， 问 
题 将 变 得 更 复杂 。 

用 来 睦 缩 页 才 的 常用 方法 是 使 用 层次 结构 的 页 表 。 我 们 使 用 一 个 具体 的 示例 来 加 洪 你 对 这 种 方 
法 的 理解 ， 假 设 32 位 虚拟 地 址 空间 被 分 为 АКВ 的 页 ， 而 每 个 页 表 条 习 部 是 4 字 节 。 还 假设 在 这 一 
Ж], 虚拟 地 址 空间 有 如 下 形式 : 存储 器 的 头 2K 个 页 面 分 配给 了 代码 和 数据 , FE F en 6K 个 页 面 
还 未 分 配 ， 肯 接 下 来 的 1 023 个 页 面 也 未 分 配 ， 接 下 来 的 1 个 页 面 分 配给 了 用 户 栈 。 图 10.18 展示 
了 我 们 如 何 为 这 个 虚拟 地 址 空间 梅 造 一 个 两 级 的 页 表层 次 结构 。 

一 级 页 表 中 的 每 个 PTE 负责 映射 虚拟 地 址 空间 中 一 -个 AMB ВЈ 9 (chunk), BERAR AR 
是 由 1 024 个 连续 的 页 面 组 成 的 。 比 恕 ，PTE 0 右 射 第 一 个 组 各，PTE 1 映射 接 下 来 的 -组 块 ， 以 此 
де. (БЕІН 4GB, 1024 个 PTE 已 经 足够 覆盖 整个 空间 了， 

MEAR i 中 的 督 个 页 面 都 末 被 分 配 ， 那 么 一 级 PTE i 就 为 室 。 例 如 ， 图 10.18 中 ， 组 块 2-7 
是 未 被 分 配 有 的。 然而 ， 如 果 在 组 据 i 中 至 少 有 一 个 页 是 分 配 了 的 ， 那 么 一 级 PTE i 就 指 问 - -个 二 级 
页 表 的 基 址 。 例 如 ， 如 图 10.18 Pr, 4980. 1 # 8 的 所 有 或 者 部 分 已 被 分 配 ， 所 以 它们 的 -级 
PTE Wii: ЖП. 

一 级 页 表 中 的 每 个 PTE 都 负责 映射 - -个 АКВ НЕШЕ ДАШ. MARRI) AE АН-Д 
表 一 样 。 注意， 使 用 4 F 60 PTE, 每 个 一 级 和 二 级 页 表 都 是 4KB 字 节 ， 这 刚好 和 一 个 页 面 的 大 小 
是 - 样 的 。 

这 种 方 活 从 曲 个 方面 减少 了 存储 器 蓝 求 。 第 一 ， 如 果 一 级 页 表 中 的 一 个 PTE 是 空 的 ， 那 么 相应 
的 二 级 页 表 就 根本 不 会 存在 。 这 表现 出 一 种 卢 大 的 洪 在 节约 ， 因 为 对 于 -个 典型 的 程序 ，4GH 的 虚 
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图 10.19 fix T fb H] cu E 3 IK ES SP EB GL t e c k t VPN 和 1 个 WPO。 
We VENE PES GS ENS. ДФ те. ЖІШИЖЕФШІҢНМІ PTE, 12jsk-l. 
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TRES. TARAA Ей PPN 之 前 ，MMU ЯЛЫ ЕРТЕ. HFAA 
НИЖЕ, PPO 和 УРО 是 相同 的 ， 
икан 


ET | өрі D 
Ф МРМ1 [e VPN2 | … — [eVPNK | УРО | 
— = 一 ,一 一 


ти 证 下 ша = ШЙ a LT: 

d | 

PPM 

—À 
m-1 E E i | 0 
| mh [РРО 


ты 


1019 A EO mss E 


B 611 


访问 个 PTR， 第 一 眼看 上 去 吊 贵 而 不 切实 际 , 然而 ， 这 里 TLB ЕМЕН, ЕА 
中 不 问 层 次 上 的 PTE 缓存 起 来 。 实 际 中 ， 带 多 级 页 表 的 地 址 翻译 并 不 比 单 级 页 表 慢 很 多 。 


10.6.4 ££: dels НІНЕН 

THE, ВАТА —1 HAST M И ORTI. ERO PEINE INE ЕРІ, 
这 个 示例 运行 在 有 一 个 TLB K Li d-cache Bh Zt E. АГЕНТТЕ, ЖЇН AD FRR: 

. {АЙ EUST SB. 

. FRUER 1 字 节 的 字 的 (不 是 4 守节 的 字 )。 

ә 虚拟 地 址 是 14 位 长 的 (n=14)。 

e ”物理 地 址 是 12 位 长 的 Cm=12)。 

s 页 面 大 小 是 64 字 节 (P=64)。 

* TLE НИ, А 16 个 条 日 。 

° Lld-cache 是 物理 寻 址 、 和 直接 映射 的 ， 行 大小 为 4 守节 ， 而 总 共有 16 个 组 。 

图 10.20 展示 了 上 康 拟 地 址 和 物理 地 址 的 格式 ， 因 为 每 个 页 面 是 2 =64 字 节 ， 所 以 虚拟 地 址 和 物理 
地 址 的 低 6 位 分 别 作 为 VPO 和 PPO。 虚 拟 地 址 的 高 8 位 作为 YPN。 物 理 地 址 的 高 6 位 作为 PPN. 


13 12 11 10 g B ? 6 5 4 3 2 1 Ü 


аш T T T I TT TTT LII |] 


4*—— — — VPN VPO — > 


(EHTE) СВ 86) 





"а СТІ 


«—— PPN ———— РРО — — — 
‘物理 册 号 ) CERE BE ERO 


61020 ДЕЕ ИТНЕ 
В 14 ЕКІНІҢ Ca=14), 12 ЕТАН ВЕ tm=12) 和 和 64 FP ИЕ CP-622. 


P] 1021 展示 了 我 们 小 存储 器 系统 的 一 个 快照 ， 包 揪 TLB (a)}、 页 表 的 一 部 分 (b) AL 高 速 


Ж (с). 在 TLB 和 高 速 缓存 的 图 表 上 面 ， 我 们 还 展示 了 访问 这 些 设备 的 硬件 是 如 何 划分 虚拟 地 址 
和 物理 地 址 的 位 的 。 
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索引 标记 位 Hb ko Юр X2 ЖЗ 


сла | 1 [83 | 77 |18 |o] 
[4] oj4-[-]1- 1-7) 





(e? HE fr: 16 tH. Due dk, НЫН 


10.21 小 存储 器 系统 的 ТБ, ДИАНЕ 
TLE, TRAHI AA ТА ET ARERR. 


* ТІВ. TLB 是 利用 VPN AELITA. ELN TLB АЛЫ, ЯНА VPN 的 低 两 位 就 
作为 组 索引 (TLBI)。YPN 中 剩 下 的 向 6 AEA CTLBT), ARIKO AERA E ` 
个 TLB ЖІК AS HIR VPN. 

RR. 这 个 页 表 是 一 个 单 级 设计 ， 一 共有 2°=256 ARAH (PTE), Aj. 我们 只 对 这 些 
条 日 中 的 开头 16 个 感光 趣 。 为 了 方便 ， 我 们 用 索引 它 的 VPN 来 标识 每 个 PTE: [ERE ЖС 
(БЕ VPN 并 不 是 责 表 的 - -部 分 ， 也 不 储存 在 存储 器 中 。 另外 ,注意 每 个 无 煞 PTE 的 PPN 
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都 用 一 个 破 折 号 来 表示 ， 以 丽 间 一 个 福 念 ， LENNART ANEA НЧА, ЖЕНЕ 
何 意 义 的 。 
. ЖАЯ, 直接 映射 的 媒 在 是 通过 物理 地 址 中 的 宁 段 来 寻 钼 的 。 国 为 每 个 块 都 是 4 字 节 ， 所 以 
МЕНЕ 2 ЕЛМЕН (CQ)。 因 为 有 16 组 ， 所 以 接 下 来 的 4 位 就 用 来 表示 组 索引 
CCI)。 剩 下 的 6 位 作为 标记 (CT). 
给 定 了 这 种 初始 化 设 定 ， 让 我 们 来 看 看 当 CPU 执行 一 条 读 地 址 0x03d4 处 字 节 的 加 载 指 令 时 ， 
2 RET A. CBHE— PETERE CPU ERE 1 FPEF, 而 不 是 字 节 的 学 ,》 为 了 开始 这 种 手工 的 
祺 拟 ， 我 们 发现 写 下 虚拟 他 址 的 位 表示 ， 标 识 出 我 们 会 需要 的 各 种 字段 ， 并 确定 它们 的 16 进 制 值 ， 
是 非常 有 帮助 的 。 当 硬件 解码 地 址 对 ， 它 也 执行 相似 的 任务 。 













БЕН ЕСТЕН 
ш usu [п o oje | e Tl IT To 
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VEN 





开始 时 ，MMU A RETOURS НУ Н УРМ Сохор), 3EH IS TLE EE RB DUBIE T TE 
КӨЗІН ИЕДІ PTE OxOF 的 一 个 指 贝 ,TITLB 从 VPN 中 抽取 出 LB 3x91 60x03 8I TLB 标记 {0x3)， 
组 0x3 的 第 一 个 条 日 中 有 效 位 上 左 配 ， 所 以 谷中 ， 然 后 将 缓存 的 PPN COxODO 返回 给 ММО. 

如 果 TLB 不 命中 ， 那么 MMU 就 需要 从 主 存 中 取出 相应 前 PTE。 然 而 ， 在 这 里 的 情况 中 ， 我 们 
БЕ, TLE 会 命中 。 现 在 , MMU 有 了 形成 物理 地 址 所 需要 的 所 有 东西 。 它 道 过 将 来 自 了 0E 的 PPN 
(Ox0D 和 来 日 虚 拟 地 址 的 VPO (0x14) 连接 起 来 ， 这 就 形成 了 物理 地 址 〈0x354 )。 

E PX. MMU 发 送 物理 地 址 给 组 存 ， 缓 存 从 物理 地 址 中 抽取 出 缓存 偏 移 СО (0х0). КТЖ 
5| CI (0x50. 以 及 组 存 标 记 CT (Dx0D)。 





因为 组 0х5 中 的 标记 与 CT 相 匹 配 ， 所 以 组 存 检测 到 一 个 命中 ， 读 出 在 偏 穆 量 CO 处 的 数据 学 
1 (036), ЖЕЕ 25 ММО, Е MMU 将 它 传 递 回 CPU. 

НЕДЕН ЫЫ ЕЛІҢЕ. МШ, ШІ TLB 不 命中 ， 那 么 MMU 必须 从 页 才 中 的 PTE 
中 取出 PPN。 如 果 得 到 的 PTE 是 无 效 的 ， 那 么 就 产生 一 个 缺 页 ， 内 核 必 须 调 入 合适 的 真 面 ， 重 新 运 
行 这 条 加 载 指令 。 男 一 -种 可 能 性 是 PTE 是 有 效 的 ， 但 是 所 需要 的 存储 器 块 在 缓存 中 不 命中 。 
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10.7 HAR: Pentium/Linux FRA 29 


RIA ЖИ ЖЕРТ ЖЕН БИП RERA RR EE UTE ER ЖН И RA E Pentium 
类 的 系统 ， 运 行 的 是 Linux。 图 10.22 给 出 了 Pentium TRR Е 8 77. Pentium 系统 有 一 个 
32 位 (4GB) 的 地 址 空间 。 处 理 器 组 忻 《processor package) 包括 CPU 4S HB. — 356—893 L2 ЭЖ 
AERE BUM E ESAE CIUS. CPU 芯片 适当 地 包含 了 四 个 不 同 的 组 存 : 一 个 
指令 TLB、 数 据 TLB, LI i-cache 以 及 L1 d-cache。TLB 是 虚拟 寻 址 的 。L1 ІКЕЙ 3А 
ifj, Pentium 9ТЕ 77 СӨЛ TLB) 都 是 四 路 组 相 联 的 。 
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3 йен 
4KB 的 页 大 小 
Li. L2 RU TLB 
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图 10.22 Pentium 存储 路 系统 


ТІВ 缓存 ?2 位 的 页 表 条 日 。 指令 TLB AARRE ЕЛ ИІЛЕ PTE, 数据 TLB 组 存 数 
据 的 虚拟 地 址 的 PTE。 指 令 TLB 有 32 个 条 有 日。 数据 TLB 有 64 个 条 日 。 页 面 大 小 可 以 在 启动 时 配 
HE 4KB 或 省 AMB. ЕНЕ Pentium 上 的 Linux 使 用 4KB 83508. 

11 ALO ERRERA 32 字 节 。 每 个 L 高 速 缓存 的 大 小 是 16KB， 有 128 个 组 ， 其 中 
每 个 组 部 包含 4 行 , L2 遍 隶 缀 存 的 大 小 可 以 在 最 小 值 128KB 到 最 大 值 2MB 之 间 变 化 。 典 型 的 大 小 
是 512КВ. 


10.7.1 Pentium 地 址 翻译 
这 一 节 讨论 Pentium 系统 上 的 地 址 翻译 过 程 。 图 10.23 描述 了 整个 过 程 ， 从 CPU 产生 虚拟 地 址 
时 ， 直 到 数据 字 从 存储 器 到 达 ， 以 供 你 参考 。 


Bux, ТАТЕ | | 

EAn eat, ALERTAR AAA R, WE MMU NX Ax 
地 址 翻译 成 物理 地 址 ， 然 后 将 物 理 池 址 竺 送 到 UL Жана. Ай, EISE MEXSA"T—-A 
BHRT, JE OE. НАЛА TLLA IA 

Pii, Ф АКВ XU dis Pentium 8 8 ЛА ИЛЕК 12 6 VPO， 并 且 这 些 位 和 祖 应 物理 
地 址 中 的 PPO 的 12 2E ЖЕ] б. BANMER, WRAL ЭЖИ 128 个 组 和 32 3 
节 的 线 存 块 ， 每 小 物理 地 址 有 个 【log232 ) ARH 7 4 Clog128) 索引 性 、 这 12 МЕН 
特 合 虚拟 地 址 的 VPO Ф, ARERR! 当 CPU 需要 翻译 一 个 虚拟 地 址 时 ， 它 就 发 遂 VPN 到 
MMU， 发 送 VPO Ж dk L1 34. Š MMU 向 TLB kk LEBEN, LI ФЕЛА) 
УРО 位 查找 相应 的 姐 , 并 读 出 这 个 组 里 持 四 本 标记 和 和 相应 的 数据 字 ， 当 MMU 从 TLB 得 到 PEN 时 ， 
35 0 5 EH ded PPN БӨ ЧО d АНГИТ. 
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10.24 Pentium ® Ж 
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每 个 进程 都 有 一 个 惟一 的 页 面目 录 和 真 表 集 合 。 当 -- 个 Linux 进程 正在 运行 时 ， 尽 管 Pentium 
的 体系 结 枸 多 许 页 表 换 进 换 出 ， 伍 是 页 表 上 月 录 和 与 书 分 配 页 面相 关 的 页 表 都 是 沿 驻 存储 器 的 。 页 面 
目录 基 址 寄存 器 〔page directory base register, РОВА) 指向 真 表 目录 的 起 冶 位 置 。 

图 10.25 (а) 展示 了 PDE 的 格式 ， 当 P=1 PF (Linux 中 总 是 这 样 的 )， 地 址 字段 中 和 包 舍 一 个 2 
位 的 物理 页 号 ， 指 向 相应 的 页 表 的 起 始 位 置 。 注 意 ， 这 要 求 页 表 要 4KB 对 齐 。 

图 1025 (bo Ет J PTE 的 格式 ， 当 P=] 时 ， 地 址 字段 包含 一 个 20 位 的 物理 页 号 ， 指 同 物 理 
存储 跨 中 某 个 页 的 基 直 同样 ， 这 也 要 求 物 理 页 要 AKB Ж] Ж. 
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页 表 存 在 于 物理 存储 器 中 【1) 或 者 不 存在 (0) 
只 读 或 者 读 - 写 访问 许可 

НГ ЧЁ ШЕН РЕД (ABRIO 访问 许可 
WK TR É I) RES S ES I| Жү, сү єз 


яр OD 或 者 启用 (0) 

这 个 页 被 访问 过 吗 ? (在读 写 时 下 MMU 设 置 ， 由 软件 清除 ) 
页 面 大 小 为 和 B (0) 或 者 4MB CD 

Ф) СЕТЕ, АС ЛАТІВ ИВЕ) 

EE T ДЕННЕ 20 hr 





(а) ПЕ Hx B (PDE) 


11 9 8 T 5 5 4 3 2 1 0 


页 表 丰 在 于 物理 存 情 器 中 《1) 或 者 不 存在 (0) 
КЕНЕН ІШІН 


RIP SEE ШЖ RE POSER, (AREA) 访问 许 吕 
对 这 个 页 表 的 直 写 或 者 写 回 缓存 策略 

ЖҰЗ (1) 或 者 启用 (0) 

引用 位 АММО Е ЕВ, ШИЕ; 
Ёо CDMMUSESIM SER. mitis 
SE GERE. ATLE F IRR H) 
UB Л ЖННД 20 位 





(b) HË H (PTE) 
10.25 Pentium 页 面目 录 条 目 【PDE)} ANRE (PTE) КН 
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PTE ІМ И НУ. ИНЖЕ RUN IURE]. RÁW yirik GEO рЫ ЕЕ ГЕ, 
AERE. US т, @ ШЕ ОГЕШ Р АГЕШЕ КЕШ, iP ТИЕН ES Nhi 
ШАК АЕН ЖЕРЕ, 

К MMU MEAT О GE HE. К ШКЕ Л ДИА И. ШЕЛЕК Ра ГЕ ZEE 
用 于 更 性 ,每 次 访问 一 个 页 面 时 ，MMU ЖИ Ж A (7, d] 4] Жі (теїегепсе мі), ШЕТШ ІЗІ 
用 位 来 实现 它 的 页 面 笨 换算 法 。 钴 次 写 页 面 时 ，MMU REED r, CURIG (ашу bi. 一 
TOEREN T W IRS don BERE Ed (diny page)。 修 改 位 告诉 内 核 在 它 排 六 一 个 秆 代 页 面 
过 ， 是 吉 必 芭 写 回 辆 牲 页 面 。 内 核 可 以 调用 一 个 特殊 的 内 核 模式 指 李 来 清除 引用 或 者 修改 位， 


яй ВТР о ні 

注意 ，Pentium ЖЖ# НӘР АНГ, Иа АЖЕ Те А, d 
*E3#d ka kam Tit EM, АЛРАН Й аА 【3.13 S) 如果 有 这 样 二 让 执行 
В. Om RHET oc ЕН д ЗААНЫ, de ИЖТ. 


Pentium Щ#ШТЁ 

ІН 10.26 7: T Pentium MMU 50 4 E] И VE, 将 一 沾 虚拟 地 址 翻 说 成 物理 地 直 。 加 dr 
VPN КӘНЕ 21-10 位 的 块 。VPNI1 在 PDBR 指向 的 页 目录 中 迪 引 一 个 PDE., PDE 中 的 地 址 指向 
ПОЗУ h ki EH K YPN2 Ж]. W VPN2 索引 的 PTE 中 的 PPN 和 VPO 连接 起 来 形成 了 物理 地 
їй. 









到 页 面目 最 的 | тт" "РҮҮ 
TAFE тана ТЕТІ. 
н" 


ТИ ЖЕ 
= Жин 
i _ (E paj) 
dig T EXE) | 
ыи Toe hl 
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Pentium TLA НІ 
ІҢ 10.27 ЖЕР T Pentium 系统 中 TLB 翻译 的 过 程 。 如 果 PTE E {ЕЕ TLBI З 21А TLB 
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бер» ЖАМАЙ PTE 中 抽取 出 PPN， 间 把 这 个 PPN 和 Уро 连接 起 来 形成 物理 地 址 。 
ШЖ ЗГ PTE, Н Ж ЕТ PDE (ТІН deri), ДА MMU 必需 在 它 形成 物理 地 址 之 前 ， 
六 存储 器 中 提取 相应 的 PTE. REIS. ШЙ PDE 和 PTE 都 没有 被 齿 存 CTLB Же), Ж, MMU & 
LAM TE Bari Hu ii PDE 和 PTE， 以 形成 物理 地 址 。 





图 10.27 Pentium TLB ШІ 


10.7.2 Linux E fü fef a if 

PEARLI ЖЕЕ ЖЕНЕ ЕНЕ ШИЖ ЕНН, ЕЕ ede p ДН 
eamm. 在 这 一 小 节 中 我 们 的 目标 是 对 Linux AEREE НЕЬ Зай. (ai ab A HET 
SAW MDM E SE nus ЕШ ЕШ. DLE ш AERE EN. 

Linux A SEE Ek T —T- W ТИНИ НЕНЕН 8], ЖШ 1028 Fo. RIBE EXER 
ШАШ Т. Rufum CE. EU, ш. WOXEHEELERHBI. ИЯСЕ, 
ТОПЕНЕ ША X mx T ИЕШЕ НЕНЩ Т. КОРР И W ГІН: Oxceo000000 之 
Pa 

n REEL TREE SL P БОР ЕНИ. PUB defe frd ORE Mode [x Boat He З ИТТЕ! Hay 
ШИШ. (iin, ЕЕЕ HORN Buried s ТИ 有 趣 的 是 ，Liaux ІІ-НІҢ 
虚 护 页 面 《 太 小 等 于 系统 中 DRAM 的 总 量 } Fe EUR E 1 xESE PIRE VL]. IX GEI hip T 

-种 便利 的 方法 ， 素 访问 物理 存储器 中 任何 特 宣 的 位 置 ， 例 如 ， 当 它 青 要 在 一 些 设 备 上 执行 存储 器 
映射 的 VO 所 作 时 ， 而 这 些 设备 被 攀 射 到 特定 的 物理 存储 器 位 置 。 

НИЕТІН ІН C ffe CIE а f THER ICT dn Ie f HR pH. BREF 
ЖЕТКЕННЕН, ДЛ ЕЕ ЫЕ ЕД ЕДА ton 

Linux IHE (RE К 

Linux fi HB 30 £r Me iR — E W Cm cO мі. “МЕ (аге) 就 是 已 你 存在 者 的 
CORE ШЇ ЕНЕН. (chunk), АЛБ ШҮ М ЖЕТ ИП LLA AER Ж XE. tal 
Ш, КЕНЕ, ЖЫШ. MEL кр, ШАШ РНЕ GRE E. S+ EM LUCR E EYE 
ҰМТ, ШЕТЕН Ж ЖҮГІН, МАЕ А Н, КШ ШИЕ. 
ИЗГЕ fe UT e dO SR Р u ІН r. НЕЕ НЕЕ EM UE. HERE EEG UTI UR SH РЕА 


620 Aint 






me Hg. МЕЙ) 


00000006 


MEET, | iE REX POBRE E Mg 
жш | (Шш, ПИ, rak 和 

"o a TM 
тевер \ 


ПРЫЕ НЫ | 






| ТТ 

运行 时 堆 1 通 过 mallo 牙 配 的 ) 
ТТГ 
БШЕК i data) 


Dx08048000 ИЖ ТЖ (тек) | 





ü 


Е 1028 —- Linux E PRESE AERE 

PH 10.29 RUN Га ЕНЕ die fe eb [C iq 6 ЖЕЕ. o ER ЕП NEP HERR 
те К ESHESNI СӘЙ task. stre. {ЕЖЕ КИР a HS Pri 
WEFEBERERE SURE АЛ. (HA, РИ, WAR REIRE. HATE TED RE. ШЖК 
2). 

task. struct 中 的 一 个 条目 指向 mm_stmuet， 它 描述 了 虚拟 存 信 里 的 当前 状态 ,我们 感 英 趣 的 两 沾 
字段 是 pgd 和 ттар. Ж ped БЕЛІНЕН, ІН ттар 指向 一 个 vm area запасах C[X M 
KRD frg, HPA vm area яла НЕТ ЧИН РШ) — CHE Cares). "i GE 
TATER. «Ж ped 存放 在 PDBR ЕЗІ. 

1 TRE HE. ДР BOSE BERE M] (vm area struct? fud КЮТЕ: 

е wn sur; 醒 同 这 个 区 域 的 起 如 处 。 

* wm end: НА АЯНДЫ ШІ, 

* wm port: 描述 这 个 区 域内 世人 滞 的 所 有 页 面 的 悉 写 许可 权限 ， 

* vm flags: 描述 这 个 区 域内 的 页 面 县 否 星 与 其 已 进程 打 齐 的 ， ЖИЕНІ (ИЕН 

了 其 他 一 些 信 息 )， 
• wm next HAHET ЕЦ, 
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图 1027 Linux ЖЩ fer in dee f ERE 


Linux ЕҢ ЕТІ 

БІЗ MMU (САНЫ НЫНАН, MET А. ШРИ РАНИЯ Н 
ЕЛЕНЕ, ЖЕРЕ КЕЧА КЕШЛ. 

|. НЫНА Bim? АВ, А 在 其 个 区 域 结构 Cvm, area struc 3E LIE] [X bg 083 ? 
A ТЇ АЛШ, ЖГНЕ ЕЕ HII bi. ЖА FIS BEER] vm stam 和 
vm end HER. WEL S BOARD, 2E RIEBERHME—TEBHIR. АШ ik out 
名。 这 个 情况 在 图 1030 ірін “1”, 

团 为 一 个 进程 可 以 创建 任意 数量 的 新 虚拟 存储 器 区 域 ! 使 用 在 下 一 苦 申 HIT] mmap ЖЩ). P 
САНА ЖЕН ЧЕН ЕН K. Die dp. ЖЕННИ o ЖГ, 
Linux ERRETA., Fa KW ЕНТ ЁН. 

2. MARAETAI ЫЕНЕН ЖЕ E] I GENE, ЖЕТ ika'y Ар RE IH 
Е? мш, ЗАРАРИ Jd - -条 试图 对 这 个 代码 段 里 的 只 读 页 面 进行 写 操作 的 存储 指 专 造 成 的 ? 
这 个 缺 页 是 不 是 因为 一 个 运行 在 用 户 模 武 中 的 进程 试图 从 内 核 虚拟 存储 器 中 读 取 字 造 成 的 ? in i ut 
Ris fr IRI rl Rs ГІ ИОА ВЕЕ Е КР, Anf ius ERES. GBA 
在 图 10.30 hiki 2", 
| 3 HE. fpc T ix UE R Hi TOS EGERIT IH BE EET fri UM FE UE]. EE ТЖ 
"gum. Wik ШИШЕК. МАЙТЫН. БА ЕШ. ХЕ ШИЖ, АШ 
В ОАА Ш. “ЖИЛЕ ТІНЕН. CPU ЖИЛ ЖЕЛЕ. ХЫНФИНИШЕАН 
MMU. 这 一 回 ，MMU 就 能 应 常 地 般 译 A， 而 不 委 再 产生 ЕСУ 
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Үп BE ti шЕгіні gm cu Е 
| 






ИНИ. 
(D uy ЮШЩ 
nli 
| 
“| @ ERRA 


urs. 
8) иш. йк, 
EET 


10.30 Linux && PA RE 


10.8 ”存储 器 映射 

Linux 【以 及 其 他 一 些 形式 的 Unix) 通过 将 一 个 虑 拟 存 站 器 区 域 与 一 店 碰 前 上 的 对 龟 (оқесі) 
Жас Ж. ОНЕЗИ ТУЕ ЕАР Е, РО АЕ В Е С тету mapping). 
Wei ép i E C n] LL ИТО Ф. 

l. Unix 3 #F 8 eb e d PR. Ы AM FL — 1 Bri n АУ е Cim — ap LT EL 
гір КЕНЕ. ЕА А ОТАОНА г d T RH AES BLUES 
trum НЕ, ИЦАНЕИЛЕННЕБТЕЯАВНІШЕ. 直到 CPU 第 一 次 引用 到 页 面 ( 也 就 
E. H5 HOUSE, ЕЕН А ЕЛШІ). mE Ie ТЕАТ ВУНЕ kus, 
qo HS RIN pP MS k FS. 

ВАЖИ, -tE URHI- TEETE £T EH KDI, BNI L 
OHF. CPU Я— K a|Hixt ЗЕДІ ЕН, BES IPP AB DIES Е 
MBN, Anci HM MRSLHI. Wii TOU HK. H- B SYN AAA TH ЖЕШ 
8. Wu DE eut S ЖН RE E Up. ЖЖ ЕШШ EAR Г ЕН REC НЕ. 
HARTEN "OM АК dS X PRÉ БС REDE ШШ. ШШ ЫН ЖЫН Cdemand-zero 
page) 

EREEREER T. -Н-ТЕНЛШЕРЕН,Т. C WA — ih КИНЕ ЕГИ а Ж 
Cawap file) [ЖЮ Ж. vri EEUU EE d SER] (swap space) ER ARE (swap area. 
需要 意识 到 的 很 重要 的 一 点 是 ， ЫНЫҢ. mies AER AE Hori dT ЖЕЕП MERE D HAE HE 
МЕНЕ. 


CELTES 523 
— RE жін 
108.1 本 看 共享 对 象 

仔鱼 器 映射 的 概念 来 源 于 一 个 隐 明 的 司 现 ;如果 虚 报 存 依 器 系统 可 以 全 成 到 传 续 的 立 件 系统 中 ， 
那 名 三 能 提供 一 促 简 单 面 高 效 的 把 程序 和 数据 各 虐 到 存储 器 中 的 方法 ， 

正如 我 们 已 经 看 到 的 ， 进 程 这 一 抽象 能 名 为 坚 个 进程 提供 自己 秒 有 的 虚 把 地 址 空间 ， 林 DE 
KARREG, 不 过 , ІРЕНЕИНЕНШПЕТАЖНН, ИШ. AT Unix shell RUF tesh 
MERA ARANIR. mH. ТЖЕ ИШ Н ДИЕ BECA, on, 每 个 
C RUE RUE R 33 Blot C 库 的 诸如 priatf ЕНІНЕН. ЖА. ШШЕН ЕИ ішігі 
ЖЖ CR ИЕЛ. ЖЕШТИ Т. Es. f BEHERITTHAT PE (7) 
HUM, HERETER maitai. 

ТУ Д ОА З EEA E БСК, 0, ЕЗ аЙ, ЕлЕЛяАЖЫЙ, HH 
А ВЕЕТ ВЕН АЕ n) i OUR БЕ ЗЕ ау — PCR AE ОЗА НЕДЕ ШЕНЕН 
ЧЕ. РАН А а ЕНЕГЕ ГЕ ШЕ КИЕ ЕЕ. 也 是 可 见 的 ， 而 用， 
казы o miram Wi t kar T B 

эЛ, УР Т А ЮКА ИШ, s TEDbEPORIE ЖИП US. ЯН 
Bout ^- p SERE MERE IERI 0 FR E E PE hah, — FH 3H qe Т £r db 
[xa ЖНА. ЖЫН. if Red HM. 

BU SERE IF- ICE REBR HERI Pod ERES D DC, mi 1031 (а) Жж. Bak 
假设 进程 2 [n] — F Е Ит tj HA Bi 8] [并 不 一 定 要 和 进程 1 EARRA, dm 
HB 1031 (b) Жл], 

ШЕРІН Ww g A > WU ЕНІН тя НЕ? 
TIR "as sung mutas ULL. guam 


E 














N 1 
1 x 
x ^ 
b ` 
N N 
LIE LL 


В 10.31 — 
(a) EF LIRM ГА ИЕН: On) 进程 DST Pty RE. (ERS HEt ERREEN.) 


因为 每 个 对 象 都 有 一 沾 惟一 的 去 忻 名 ， 内 核 可 以 迅 囊 地 判定 进程 1 已 经 帅 射 了 这 个 对 香 ， 而且 
可 以 使 进程 中 的 页 表 条 目 指向 相应 的 物理 页 面 。 关 键 点 在 于 即 收 对 单 被 映射 利 了 志 个 北京 区 经 ， 
物理 存 情 路 中 也 只 需要 存放 共享 对 象 的 一 个 拷贝 。 为 了 方便 ， 我 们 特 物理 页 面 显示 为 过 撑 的 ， 间 是 
在 一 般 情况 下 当然 不 是 这 样 的 ， 
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VEL RICH] CERIS SEHE Ж Ceopy-on-write?. РЫ ЖӘН НЫН DE. — 
ТЕНМЕНЕ Еа ИДУ АК Е 336 sn — 6, ИЕН ЕЛЕНЕ - 
НЕШ. Шш. PH 1032 00. ERT- ЖРА ERE Ro ERI EFE EL LEE 
SPICE, IBEEJESGETOH EE [SI —5- ШЕШ. Ж-Н ЕГИ P ERR. ШЫ HE M 
HL SERERE EHE OR eO FL, ER [Eh ES c AERE REAL. ПЕШЕНЕ B c 
ЖЕЕ. ENTRE RI CLASE COUR RS FECI PRER IIT ein. ЖШ, HOE T HER uti 
АГ РЕА, MAk T MTS AME КЕНЕ, 

"IHE SERI НЕЕЖ ИР ИЕ ЖОН ЕЕН PEE ИЛГЕН I n D EB D 4 CT 3L de 
ШІ, ҖЕНЕ GREC CE DO Sim, ТИ НЕТ ЕШШ. ЖЕЕ 
复 这 个 页 面 的 可 写 权 限 , 如 图 10.32 (b) Жл. yi ee RE ЕЕ БЇ}, CPU 重新 执行 这 个 写 蜗 必 ， 
现在 在 新 创建 的 页 面 上 这 个 写 粮 作 就 可 以 正常 执行 了 ， 

IL SUE MEHR hit) UO BUR Е arp fep ЕЕ LM IH GER. TM IEEE RR. 














进程 1 的 ия 进程 3 前 AN 1 的 "in aW 2 El 
астма А. зкана LLLI MiB апта 
X, e E- 
^ 
A Ñ 司 私有 的 写 
N N | p air 
X x / 
\ \ ғу | 
КА ГИ. | 
. x P oj | N 
1 i | | 
* П / Д x 
кг ERAH 
жө тік? 


81032 一 个 私有 的 写 时 拷 见 对 生 
a) АРТЕРИИ ИИТИИ УЕ. o ВЕ TENKE h= КЕ? Е. 


10.8.2 再 看 fork 函数 

APT IM Tdi ie ER fr dH, HZ TUI 忆 请 晰 地 知道 fork & nr dst — + 
ТІН ru die e ht Q6] ТЖ ЕЙ. 

S fork ifi BERE ПЕД ПИН. NOS tapa ia p ESE, ТЮШЕ IHE DH FID， 
Ar ГА КЖЕ ШИ HERO ҒӘ. "ЧЕ И ТҮЗ ЕН mm struct. ӨМ Cvm, area. struct) 
和 页 表 的 原样 持 见 。 它 标记 两 个 进程 中 的 每 个 页 面 为 只 该 的， 并 标记 两 站 进程 中 的 每 个 区 二 站 构 为 
秘 有 的 写 时 挝 贝 的 ， 

当 fork 在 新 进程 中 返回 时 ,新 进程 现在 的 虚拟 存储 器 刚好 和 调用 fork 时 存在 的 虚拟 存 导 器 相同 ， 
当 芝 两 个 进程 中 的 任 一 沾 后 来 进行 写 捍 作 时 ， 写 时 拷 由 机制 就 会 创建 新 页 面 ， 因 此， 也 就 尖 握 车 坟 
FON TSe ep REA. 
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10.8.3 Ж execve ЕН 

LEE Bh E fr E ЕНЕКПЕН ТИЕ Ева XU S. BARES 
BU ТЕЕ. ТЕГЕРЕ МИ execve i CE ID ДЕШ {ПНЕ ЕН. 假设 运行 大 当前 进 
程 中 的 程序 执行 了 如 下 的 ехесуе WH: 

EXxecvei*a.out*, argv, environ); 


execve AATE d PE Т EE TT UA Е ОГТ ELE ow 中 的 程序 ， 用 aot PETA 
Bh EHE T SB. MEJZI aont TEREELF IL 4 bN, 

. МЕСЛАНЯРЕН. ШЕТТЕ РЇНЇН ЕН" ЕСТЕ ШЕ Н), 

в BERE. ШИРЕ K. NOE. bs 和 朴 区 域 创建 新 的 区 域 站 构 ， 所 有 这 些 新 的 区 
域 者 是 和 有 的 写 时 拷贝 的 ， 充 本 和 政 据 区 域 被 映射 为 gout PREEN. bue 区 
МЕНЕ ІНЕН, ӘННЕН, ҚҰРМАН аш 中, 栈 和 堆 区 域 也 是 请 求 二 进 
ШЕ. БЕН. Ш 1033 MURS T R li CHEF ARH. 

e BERE "aon БИЕ Ей (或 目标 链接， 比如 标准 已 库 libcso, ML2E 
兰 对 象 帮 蚌 动态 链接 到 这 个 程序 的 ， 振 此 醒 射 到 用 户 志 扫地 址 室 间 中 的 共享 区 域内 ， 

"OE AIRE РС ).execve 做 的 最 后 一 件 事情 就 是 设置 当前 进程 上 下 文中 的 程序 计数 器 ， 
ШЕ ИЛ ЖААП. 

ТСИ АЕА ЧА Н, ТАРАЗАЛАП GEBAUT. Linux Sri o ЕЮ ^ femme gi 


нен | Junt. dites 


É 


шею ГТ > 
k bm — 


£ 
ж L -. F 


to^ ry АСЕ ы 


(Bit malloc 身 配 的 ) 
E bas) Hun. ШЕ - I LIU 
—h[ 


тне | ев ТЕРІ 


A. pum. знана 


іш 
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10.8.4 使 用 ттар ҤЕ Р fr fi SR d BJ 
Unix 进程 可 以 使 用 ттар & ЖЕНЕ И ИЕШЕ ЫН, НЕ ВЕНЫ, 


526 кш 


Mincludg «unistd.A4s 
Pinclude «asys/mman.hs 


void "mmapivoid *start, size t length, int prot, 
int flags, int fd, aff t a£ffsaet]: 


ам, жалғыз атынын, FH 8-І. 


ттар ЕЕЕ ТУ dei fe [S 83, Ж ДЫЛА start 开始 的 一 个 区 域 ， 并 将 
КӨНЕ fd НЙН Б — Е ВЕТА В (chunk о ЖЕ ЧЕК. E PEDE ER all C chunk? 
二 小 为 length FW, Mer PE TR Е # offset 字 节 的 地 方 开始 。stant АНИЙ e t, 
AHELA NULL。 为 了 我 们 的 目的 ， 我 们 总 是 假设 起 始 地 址 为 NULL。 图 1034 Тж 
EMEX. 





length 7 





affset 
CET 
EH RETE ү HP: 
raa УНА 


图 10.34 mmap ӘЕЗІТЕНЕЕ 

ЕШ pon АЕ ЕА e fe E PCR ААС ЕТ СШДЕ. ЕЕЕ BO Kr rp d 
vm, part 27) 

е PROT EXEC; АХАН T mo e ur L CPU 执行 的 指 专 组 成 。 

« PROT READ: 这 个 区 城 肉 的 页 面 可 读 。 

* PROT WRITE， 这 个 区 域内 的 页 面 可 写 。 

e PROT NONE: 这 个 区 域内 的 页 面 不 本 被 访问 ， 

参数 flags НЕН Ж ЖИЕ (rH Ей. ШЖ MAP. ANON СЕНЕН fd % NULL, 
NL, WR RE FUR SEE УЕ hn, MARNA LUE ЕЖ ЕА ЗЕ 0). MAP PRIVATE 表示 
VERSER IS — ЕЛЕНЕ UL SERE. ІП МАР SHARED 表示 是 一 个 共享 对 象 。 例 如 

Биёр = Mmap[MULL, size, PROT READ, MAP PRIVATEIMAP АМОМ, 0, Ü); 
LARGER size PURRE AH. eR db E d ELE IER. 如 时 调用 成 功 ， 
Жл, bufp 名言 新 区 域 的 地 址 ， 

munmap бй S 8 Ni тй ЖК М. 


musa 





Жілеішіс «unisatd,.hs 
ñinclude «&ys/mnan.h» 


| int munmap|[void *'start, size г length]: 


Am. ЖАНИЮ 0, ЖЕННЯ-І, 


munmap # ЖУ, fre be start 开始 的 ， 由 接 下 来 length 字 节 组 成 的 区 域 ， 接 下 来 对 已 性 附 
X MATE RR ІЗ | | 

SIH 105 СИЕ нала асабй Ei 

lh 1S — i C 程序 mmapcopy.c, 48Ж mmap f — 48 $ A |M S & A ORE йош. MER 
ПЕТИНЕ фф кф Ны. 
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с AREI EHE RTI mmap 和 munmap if ЖЕНЕ БІНЕ BRI E INC BRE NCC RU 
HERES VEI ТТЫ ЕНІНЕН, ITI Hob b 6 W ЕНЕ (dynamic memory allocator), 
一 个 吉 坊 存 全 器 分 配器 维护 着 一 个 进程 的 虚拟 存储 器 区 域 ， 称 为 堆 Cheap) 图 1035). ХЕК EW 
9] Unix Ж, 地 是 一 个 请 求 二 进 制 稚 的 区 域 , 它 紧 接 在 未 初始 化 的 bss ЕМЕН, 并 向 上 生疏 【向 
到 高 的 坎 址 )。 对 子 每 个 进程 ， 内 核 维护 着 一 个 变量 ык CGEM “break ")， 它 指向 堆 的 顶部 。 





ИШЕ, эл bt 指导 


ЕНІНЕН ibas) 
ЕНЕМ (даға! 
| REEE (tent) 


Ш 1035 Hn 


分 配器 将 堆 视 为 ВХ ТВ (Бю) (otto iti, STAR RE IHR EL TERRE DE 
HIA (chunk), WA Re ІНЕН, ЖЛ, R He. CHPH (Wok) OUR II EH EH), зз 


628 $t _ 
HIRRET. РСЗ ЕСН А ИГЕ. — E PIL BASS. RSEN, u 
Wn Es BE NHEMHTE. ЖЕЛ, ЖТР ЛЕ ЕН ЕЮ IH iri. 

экантвкжын, ең КЕ КҮН Ch HERR. G TIR EE]: ii ЕНИ ЕЧ 
n BUE CLP IGITUR. 

Р Ж (explicit allocator!. ЕЖЕН tuere pomi. i. С БЕЕН НЕ 
РШ malle ЖЕ АНЕ. C 程序 通过 调用 malloc ЖЖЖ ір, 六 通过 调用 free 
НЕШЕ IHR. CP new 和 delete #+Е Б СӨЗІН malloc 和 free 相当 ， 

ӘЖ (implicit allocator?, f£ 5; — Jj dj. 38: 2 ИЕШЕ I E Ab E ERE AR 
H, fiae EB. MC Arf ЫК ЖЕ (garba collector), ü Bay ЕК ЖИИ руе 
rfc ERE ЕН НИЯ Я. (garbage collection. Hiin, МШ Lisp. ML 以 及 Java > ЖЕНЕ 
ЕКЕН ИЕ Е ВЕ ЖА. 

& Te rare АКЕН, ROBRE 1010 Ай РН DEM. 
КГЕДІ RYE EP РЕНА FEE DAC B. Wm, КЕПКЕ ТЇГЇ E А 
нс, a bi EE KL ЕР. нш, ШЕШ Е ЕТУИ УТУ" 
EGER CAO HUM. ЖЕГЕН ЭКЕЕН ЕНИ ЕШ ЕН РЫ Ж. ШЕ A 
Н НЕ А 


10.9.1 malloc 和 free 函数 
C ben HEBEL TT CR шік REGIE S;toS. FER ДЇ malloc РАЛҒАН RC 
E. 








Binclude «srdlib.h» 


void *mallocí(sirze t sizes]; 





ая, EAR. EHE NULL. 


mallo: Нб Bri e] — ЧЕН, fb ch a Ж Л» size PANTEA ate yn] {4 Ей 这 个 
БИН ТЕГЕП ЖЖП Ж. G 1830 Unis ЕНГ. mallo 返回 一 个 多 Td (RF) iH L 
A TRIER, size ЖН X S unsigned it (ЕНЕ), 


Жї: — PRES EK 
回想 一 下 在 第 3 章 中 我 们 对 IA32 КЕ КАМНЕ, ша 将 4 $59 Bex. Ms. dk 
Tv. АПЕТИТА AT PM. канн Йй. йн вн. 


ШЖ таПос 382053418 (ш. БІН РНН ан SR LE НЕЕ MACRA 
І NULL. PFRN erno. malloc ЖӨ Н E B НІМЕН, Ж qt Com es (iir) ds ig D B) BS Hi 
程序 可 以 后 用 calloc. саПос 是 一 个 基于 malloc ЖНА Cwrapper) ЖШ, ТЕНЕ ERN TUS 
VO. MEE- URE AURI AK. ЕРІМЕН realloe ЖШ, 

S135 ENS МАЕ CUm malloc) 可 以 通过 使 用 mmap 和 munmap Br. SUP НИ ДИ 
ҒЫЗ, пр shrk EN. 
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finclude zunistd.h» 







void *sbrkiint ineri: 





iu. Жалы жан, ЖЕЕ А-1, 
——————————— ТЕ MUN UPS МЕН. ЖШ! 


sbrk РВ 098 1 ES I) brk 指针 增加 iner ЖЕН Н. шй. ЙЕН brk МІНІ, 
"UM. aiie- Ж emo 8 W ENOMEM. ШЕ incr 2%, ЖЛ, «ык 就 返回 brk ta EH 
用 一 个 为 负 的 iner 来 调用 sbrk ЖЗНЕ, ТІНІН, МЫН (ык 的 旧 值 》 BB OTG F 
KE abs Cne 字 节 ， 

FE BL WH] free Ж Ж Же ЕКЕШ. 


Pinclude «zatdlib.h» 


void freei(void *ptri; 


pur НОЯННЫҢ — F W. mallec ФЕ РИК ELA Rie Md W. RC H.E free 的 行为 就 是 
FEX. ШШ ЇЙ. ЖЕТА КҖ. free 就 不 全 告诉 诺 用 出 再 了 情 误 。 B IBTETBE 10,11 
ШІМ, жеуі, K тн. 

图 10.36 展示 了 一 个 malloc 和 free ТЕ ni ERE С ЖЕШ 16-й (EE) 小 的 境 的 。 
每 个 方 杠 代 表 了 一 个 4 字 节 的 字 。 租 线 标 出 的 矩 带 对 虚 于 已 分 配 埃 【 有 阴 些 的 ) Ж (JE 
т Was, HEB 73089 16 409. Яғ. PARR. 

° [H 1036 (а); 程序 请 求 一 个 4 字 的 块 。malloe НЕН, P.S ИИГЕ ЕН е 4 ELS 

т, ds — Tix T BN re. 
e [1036 (b): RITU K—^- 5 ТІН. maloe 的 响应 是 ， M WB BINE HN 6 “F 9 
ik. ЖЖМ, maloe 在 块 里 填充 了 一 站 额外 的 字 ， 是 为了 ЕРНЕСТ N HF H. 
* ТОЗ (с), ЕНЧА Ж A 6 ТІНІН, ІП malloc ЖА SS IRR FT HERE UTR — t 6 FOR, 
e |1026 (d): БИТЕ ЕТЕН 1036 (h) НЕЕ FER. ERE, 在 调用 free ІНІН; 
їп, 指针 ро {ЕЕН REEL ТІНЕ, PE HHH THEE FSB maloe ELE de 
Й, ЖЕҢ р2. 
“ 图 1036 (е) 程序 请 求 一 个 2 字 的 块 。 在 这 种 情况 中 ，mmallas r Fi E hak T W] 
ВАВ АВР, HER- tikt Eht. 








(а)р1 = malloc[4*gizeo£fiint]] 





(b)p2 = malloc|[5*gBizeofiint]| 


630 # i0* 





(сірі = mallaci&*sizeofíiint)] 





(сірі = malloc(2*sizecf(int)] 


НЕ 10,38 В тоюс а ни WI 

ЛИНН р OU T T. AIRRA БЕ Е Tb. Cen ҮН О. “ШЕ ЕЕЕ). HIE [Е 
tst nin. 
10.82 为 什么 要 使 用 动态 存 情 器 分 配 ? 

程序 合用 动态 存 情 丑 分 配 的 最 重要 的 原因 是 它们 人 既 常 直到 程序 实际 志和 有 时 ， 才 知道 基 些 覃 杨 师 
Hid. im, 假设 要 求 我 们 编写 一 个 忆 程序 ， 它 读 一 个 aT А5СП 码 改 监 的 链表 ， 每 一 行 一 个 
W. M stdin #|— + C Hosts c e EN п, RE FOEEEUERI EMERUM SEP n T We i GET 
Mie nA ak ДЕ CP ИНИ mH k rg AC ede X k b Н: 

1 Pinclude "'csapp.h" 

4 Wdefine МАХН 15213 


] 

4 int array [МАХН | у 

" 

6 int maini) 

" 

B int 1, ma 

10 Bcanf("*d*, &n)i 

11 iE іт >» МАХН! 

12 app error|"Input file too big"); 
L3 fer іі = D; 1 < nj 1++] 

14 scantf|*Sd*, &arraylil): 
18 exitiü]: 

l6 } 


ИЕК НН К po РА lB Л ЕЕ ҤЕ. MAXN 的 值 是 任意 的 ， 和 机 器 上 可 用 的 虚 
WW asua Sa X. mH. Nx ТЕРЕНЕ ЕД ES MARN Kif HE 
-的 办 法 就 是 用 一 个 更 去 的 MAXN (FCRC BE EE FEF. MAATA ТӘ n PIC RI A nË 
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HIER, ІНДЕ ЖА BU HUIUS THER Н ЛАН А ЫР FEES DEP a, RER 
Ж i nS. 

一 种 更 好 的 方法 是 在 运行 时 ， 在 已 知 了 n EZE, SSH BR SH. ЛАНЫ, Ж 
组 大 小 的 最 估价 就 只 由 可 用 的 庶 拟 存储 器 数量 来 限制 了 。 


1 include 'csapp.h" 


2 

3 int mainii 

1 { 

5 int *аггау, 1, п; 

6 

7 scanf("S$d", ап); 

8 array = (int *}Ма11ос{п * sizeofíint]); 
9 for (i = 0; 1 < nr і-ж) 

10 scanf("*d", &arrav[il): 
11 exit (0); 

12 {| 


动态 存储 器 分 配 是 “种 有 用 而 重要 的 编程 技术 。 然 而 ， 为 了 正确 而 高 效 地 使 用 分 配器 ， 程 序 员 
需要 对 它们 是 如 何 工 作 的 有 所 了 解 。 我 们 将 在 10.11 节 中 讨论 因为 不 正确 地 使 用 分 配器 所 导致 的 一 
些 可 怕 的 错误 。 


10.9.3 “分 配器 的 要 求 和 目标 
显 式 分 配器 必须 在 -- 些 相当 严格 的 约束 条 件 下 工作 : 
。 处 理 任意 请 求 序列 。 一 个 应 用 可 以 有 任意 序列 的 分 配 请 求 和 释放 请 求 ， 只 要 满足 约 东 条 件 : 
每 个 释放 请 求 必须 对 应 于 -一 个 当前 已 分 包 块 ， 这 个 块 产生 于 以 前 的 分 配 请 求 。 因 此 ， 分 配 
器 不 可 以 假设 分 配 和 释放 请 求 的 顺序 。 例 如 ， 分 配器 不 能 假设 所 有 的 分 配 请 求 都 有 相 匹 配 
的 释放 请 求 ， 或 者 有 相 匹配 的 分 配 和 空闲 请 求 是 嵌 套 的 。 
e 立即 响应 请 求 。 分 天 器 必须 立即 响应 分 配 请 求 。 因 此 ， 不 多 许 分 配器 为 了 提高 性 能 重新 排 
列 或 者 缓冲 请 求 。 
e 只 使 用 扒 ， 为 了 使 分 配器 是 品 扩 展 的 ， 分 配器 使 用 的 任何 非 标量 数据 结构 孝 必 须 保 存在 堆 
H, 
e XR (对 齐 要 求 )， 分 配器 必须 对 齐 块 ， 使 得 它们 可 以 保存 任何 类 型 的 数据 对 象 。 在 大 多 
数 系统 中 ， 这 意味 着 分 配器 返回 的 快 是 8 ZW ОСЕ) 边界 对 齐 的 。 
。 不 修改 已 分 配 的 块 ， 分 配器 灵 能 操作 或 者 改变 空闲 块 。 特 中 是 ， 一 旦 块 被 分 配 了 ， 就 不 多 
许 收 改 或 者 移 动 它 了 上 。 因 此 ， 尘 如 此 缩 已 分 配 块 这 样 的 技术 是 不 允许 使 用 的 。 
在 这 些 限 制 条 件 下 工作 ， 分 配器 的 编写 者 试图 实现 吞吐 率 最 大 化 和 存储 器 使 用 率 最 人 化 ， 而 这 
ИТЕ ПЕ ЖЕЛЕНИ ЗЕ. 
e 目标 1: 最 大 化 吞吐 率 ， 假定 于 个 分 配 和 释放 请 求 的 某 种 序列 
Ra Ryu, Eu, Rai 
我 们 希望 -个 分 配器 的 吞吐 率 最 大 化 ， 吞 吐 率 就 是 在 每 个 单位 时 间 里 完 成 的 请 求 数 。 例 


632 | 8 10 + Б 
如 ， 和 如 果 一 个 分 配 回 在 1 E ARE 500 个 分 配 请 求 和 500 ГРСТ КЕ. 3 ЕЕ Ж@ 
ЖЕ 1000 ВЕНЕ. —@ Л. PUTREELIE TT ЕНА ЕКЕНИН ЖІНЕНІНІНІ ЕЗ fh 
ЕНЖЕЛІ, ЕШЕПЕЛЕІШ, Р ДАГА ВЕРЕ ВЕРО ЛЕШЕ Ш%. SMS EE 
iE JE ff T E E RI fr [Н] 5 SR Е ЕВЕ FER. И Е ed IM 
n gm S. 
€ 目标 2; K X dA EE HUE, 天 让 的 程序 员 经 常 不 正确 地 假设 虚拟 存 估 器 量 一 个 无 限 的 次 

源 。 实 际 上 ， 一 个 系统 中 被 所 有 进程 分 配 的 虚拟 存储 器 的 全 部 数量 是 过 磁盘 上 变换 空间 的 

数量 限制 的 。 好 重 程 序 员 知道 虚拟 存储 回 是 一 个 有 限 的 空间 ， 光 训 高 效 地 合用。 对 于 可 能 

к=к h Kik IEEE ES FS НЕ. ЖОШ. 

Hi eg AX xe NB HES) mE. КЕППЕ, ЕЗІЛІП 
PRI (peak utilization?. Wl OU PE, Jeu n “НЕЕ И ЖЕЕ ШЕ 

Ra R, Res R. 

Ш W HERE НЕНИ К< p EIER, LARUM D p HJ t W Cpayload) R p Ed. 
(WDR ROCHE ps EROR Й 5 Caggregate payload). de; P， 为 当前 已 分 配 的 霹 的 有 效 
AR. I H, 表示 堆 的 当前 的 单调 不 降低 的 】 太 小 ， 

ША. B kTACRIFPEREE A, ERA U WAFAA: 
тах ы Б 

Н, 

Ж, ЖСН НЕЛЕ ЕНЕ Ж ИНЖ ULL ЖА. ipm THEE ERE. Ж 
Кин ЕНИ ЛЕНЕ Ж ШЕРИ X KI. НЕ, CRANS Ati. ARRAS HAN 
же. ШЕЖЕ Н T TS BS BERI ТЕРЕК Н ct 1 EI E SER. 


Sut. НЕВИННЕ 


我 们 可 以 通过 让 Н, Жз E k a š$, 从 而 使 得 在 我 们 对 ІЛЕ ЗА EC RH 
НЕЗ, ЕЯ R ЕН, 





U, = 


10.84 &EH 

ЖЕҢЕ HIS IR AE PS E E IDEE Ы Н (fragmentation) 的 现象 ， 当 吕 城 有 来 使 用 的 看 
岩 器 但 不 能 用 来 满足 分 配 请 求 时 ， 就 过 生 这 种 现象 。 有 两 种 形式 的 太 片 :内 部 碎片 (intemal 
fragmentation ! 15-3559 H (external fragmentation ). 

RASSE HOGSEEERXRR ISTE. ВЕЕНПТЕЯ СЫН. Pn. — 
个 分 配点 的 实现 可 能 对 已 分 配 块 强加 一 个 量 小 的 大 水 什 ， 而 这 六 大 小 机 比划 个 请 求 的 有 将 载荷 大 。 
或 者 ， 就 如 我 们 在 图 1036 (b) 中 看 到 的 ， 熙 配 雷 可 能 增加 块 赤 小 以 福 足 对 齐 的 束 条 性， 

让 部 呼 片 的 量化 基 简 单 明 了 的 ， 它 功 是 已 分 配 志 和 它们 的 有 效 载 春之 荃 的 和 。 因 此 ， 在 任 音 时 
СВИ EL Tu WW КЕЙ КИЕ ҮП; Ж. 

"HEAR ДЕ А И ТИ ЕЖЕ ИД NW, BEST FB 3 EI EE 
TEURER ИЖИ ЕШ. Bh. ШЕН 1036 Ce) {ЖИ etx. ТАА 2 Е, Ж 
A fn A AP НАКИ ЖЛЕ d OL fb E ROC HO ДЕ Ы ЕЖ, ЩИ ТЕҢ Р ШИК 6 ЗІНІ , H 
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ЕЖЕН Tik 6 Ty RHET EHI. 

УРА АГ EC PADRE Hr LC SE HUE PI E ІНТЕТИБАЕРЦИЯЖ МЕНЕЕ ІНІ 
қ, ТЕ РАКТА. Bun. RE k ТИРЕ, ВГ EB КЛ ИШЕ БЕ atk. 
ITE ТГ H ST ЖЖ ЫЕ ТИ ЖИ ЕТИ, ШЖК ЕИ ЖЕШКЕ a TED 
Ti. ЖАЙА ЕТШИ Н. 8—558. Е ЧИЗ ОК Е а СОВА, ЖАҢ 
КЕШЕНМЕН. 

ІН ЖЛЕ Hr ЖЖ ШАКЕЛ TRE 00). КЕЖЕ ЖЕЛЕДЕ Ж ИШНЕН AE 
Жн. Wi EM KRE v. 


10.855 实现 问题 

可 以 思 像 出 的 最 简单 的 分 配 回合 把 堆 组 织 成 一 个 大 的 字 节 数组 ， 还 有 一 个 指针 PS reb 
个 数组 的 第 一 个 守节 。 为 了 分 配 візе S W. malo 将 下 的 当前 值 保 存在 模 里 ， 和 将 P 请 加 sie, TERRE 
Р 的 旧 值 逼 回 到 调用 函数 ，free 只 是 篇 草 地 授 回 到 调用 函 星 ， 而 不 做 其 他 企 何事 情 ， 

这 个 简单 的 分 配器 是 设计 中 的 一 种 极端 情况 , 因为 未 个 тайос 和 free 只 执行 很 必 量 的 指 志 ， 香 
Ийт. Юю. [НЯН ЖЕН IEE riqi, ТЫ ШИШ ЖЕШ. —1-5 ШЕ 
在 春 叶 率 和 利用 率 之 间 把 握 好 平衡 ， 就 必须 考 虚 以 下 儿 丫 问题 ， 

“ңиш, ШПшіН ЕЗІНІҢ? 

“ЖЖ 我 们 如 何 选择 一 个 音 适 的 空闲 专 康 放置 一 个 新 从 配 的 专 ? 

. SS CERVI НАСЕ С LETS Б, PRACT SERE T RH D iM 

s 

. СР Bu Tünfr amA Е О 7 

ENTE NIE А БИШ. ЕЛЕНЕ. КНЦАОЛАНШШЖЕНЖЕН ТІГІНЕ 
КИН ЕНЕНЕ. тығар ке nl M RO SC fH ЕП h e D] op EG E npe fH ET 


10.86 AZERA 
{ЕГ КЕЛН ЖИЕ — dede b Hg. Я РЕ ЖОШ. ЖЕП БЕН НН. K 
ЕН дан ШЕН sp, —4-Ш Ro dem 10,37 所 示 。 
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fpi. HERI TEN EK. f «EE. CLR UTER —#®Ш ЕИ HR RA). 3 
MESTR RNAt CHER ЯҒЫ GA Ж). ИДИ R Co fei RES ЕЙ. n SUR TN 
ШЕНИН. NA oS TEN. НЧЕ ЗЕ, El. A 
TER FERE 29 еңі, SIKS RET жыланы. (кіні, RHETID Emi 
Bib cai xmi TR OSEE. ЖЕЗ. fin. БШАНІН onm. 
大 小 为 24 (өкі) FH. WA TEES 

üxpDOoOnnD18 | 2xi = (хП0000019. 

ЖЫН, —T B X X 40 (0028) 字 节 的 空 困 块 有 和 如 下 的 头 部 ， 

üxD0QUOD28 | 2x0 = ПхйПООПП2В, 

3 RES 8 S JE PER] EL mallos БНАЖЕНІҢЕЕ. ORI Gd e eH ЕШ. JH OK 
МЕНЕЕ, ЖЕНҢЕНІЕЖЕН, bg. HOmopie Re mm ao. ТЕЗІНЕН 
К. ЖЕШИН ЖАДИК Ж. 

假设 埃 的 格式 如 图 1037 б) RETARA у —- p VH ЕНЕН И Ee P P. 
ІҢ 10.38 所 示 。 





1038 用 隐 式 空间 链表 来 组 织 二 
СОИС ЕТЕ THREATEN. LERTA Ooh СЕМ EHEN. 
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header), CARET 109.12 T aji, S RE NINE T SERERE HIELO 

Hats pde Е mes ЖЕНЕШЕ. ИШЕ Ab. ШУНЫ 
SEHE nne ЕДЕ БЕЗЕ Ж. 

WORSE P ЖЖЖ ЕЕ ЖЕЛКЕН АНАН И WE FAIR HI k al 
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Wk. ЖАТ ИШ HER SOY ERE. Hi. PE 1037 rap EH ta НИЛ 
ПАНА» ЧЕ, "—degHHOM AERGE. АЕ Uk ғр, HAUS UAR 
EEUE- TARNE. 
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109.7 放置 分 配 的 块 

当 一 个 应 用 请 求 一 个 上 字 节 的 块 时 ， 要 本 名 搜索 空闲 链表 ， 查 找 一 个 足 是 太 。 可 以 放置 所 请 求 
央 的 空 闻 块 。 分 配器 执行 这 种 搜索 的 方式 是 由 被 置 策 团 (placement policy) 确定 的 一些 壳 见 的 第 
HETRE (Шай). Т-ЖИЕ (кеміп) ЖЕЗ (befi). 

ЕХНЕНЛІҢЕМЕТИНЕЗ. GENER CT TEES HEB. T Ed RE RR SL, 
НАЕ АДА B. W e iT ERES ER. ТОА ЕРЕ АОН НЕ. ЖіШЕКІНЕ 
TEE, ЕАСИ ЗЕ ED ЕНШ. 

EMER- THE d ENT MEX E PE BE TE SEES US M IA T dE 
ЖЛЕ For ШЕЙ" EU "Lx EN TEE CH ir d d a] F— OS ЈА ia Donald Knuth 
macies. NTuiH-THUE mnm* 34] L -— wak HARTE 
EART- RE Edu F—HRIHRIEEER Е БА rh E И . F-— ЕЕН ЕИ 
MueipEckiHug ЕШ +. a, -SWAEN Е ЗЕ ВОВЕ Н ЖШН И ЖОЕТ GEN 
E. WAR ЕШ ЕКЕ КЕЕ КЖЕ РОИА ER—S6. Жї. {ЕЙ ЙН ЗЕ 
mg. КШ ҢЕР. AHRR AREER EUER ER ERR. КЕШ. 
КІНШЕТИІННЕ ЕМ o Кз Н Ж E. EXER T E ЕЕ Е. ПЖ Ж {ГИК 
ЕТЕ. 
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ЕН. mam NEN TE ЕНЕ. Wo НИНЕН ЖГ tm), 

EE ШЛАГ, ЖАЗАНЫ ЖАЛАНЫ ISPP NE. Ж—Ш ЕШ 
也 块 ， 面 制 下 的 变 威 一 个 新 的 空间 抉 。 图 10,9 Жк T ЕШШ ЕЛІН 1038 rh 8 ТІНІНІҢ, 
来 满足 Шанды д 
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E 10.39 йсй. 以 满足 一 个 3 填 字 的 分 配 请 求 
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器 中 物理 上 相 部 的 室 闲 块 来 创建 一 些 更 支 的 空闲 块 ( 在 下 一 节 中 描述 )。 炬 而 ,如果 这 样 还 是 下 能生 
成 一 个 是 授 天 的 块 ， 成 者 如 果 室 闲 志 已 经 最 大 性 度 地 全 并 了 ， 那 冬 分 配置 就 会 向 内 核 请 求 矣 外 的 排 
Аы. ЖАНШШТЫН ттар, 要 各 是 通过 调用 sbrk 函数 。 在 任 一 种 情况 下 ， 分 配 蜂 帮会 将 额外 
的 【或 增加 的 1 存 企 器 转 尼 成 一 个 大 的 空闲 埃 ， 将 这 个 块 场 人 到 室 闲 链表 中 ， 炮 后 将 逢 请 求 的 志 放 
WERT FP HEB (n. 
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НЕН Т ГАСА, ПЕН Д З ГЕЗА БУ УЕА Eb HEAT. Baen 
ИНАН ТЕ Е. ШИНАН (fault fragmentation). 3&8 fri Зр РЕ Ep e P Ee ee ped b 1, 
ІН. Xi. ШШ. ІН 1040 He T Ж 1039 {ЕЕЕ ЕШ. E LAS 
НІНЕН, ВТАА IU 3 T. ШЖ. HE FX Ea ETAGE DECEM 2 kW. 
ИНЕ ЛЕНА СОМЕН. ap ДЕЛА TR. 


未 使 用 的 






BE 10,40 假 碎片 的 示例 
ӘРКЕТ ЕЕЕ. ope c. Co) CEWY ЕЛЕУ). 


^ IUBE BE. {ЖИЛ ЕЕЕ HERR ACH E IRR, WB у e 3f 
Ceoalescing). ЖИЕН Y — RE NU der. MARRARA. SAHNE EUR AE Р $ 3 
(immediate coulescing), IB icf — HABER. ВАТА АВ. ui Idea ELLA 
45 2-5 Cdeferred coalescing). {#Ж R 3893414 HiBb ШЫ Bi ERAR. (МП, ipfe HE REEL AER 
HH. ВТРАТА КИ, ЖЕНЕ, ЕЛИН. 

THIS T. АЕ ИНТЕ. BES Nee IE C. ХЕЕЕ 
Te. Жанынан, КИЧ ЕРИ. 例如， 在 图 1040 h, НЕМЕНЕ 1 
3^7 IHRE I CK NOR DE I Ra dE. FERAT HEB P. 我们 全 假设 使 用 立即 合并 ， 
та FM. HET KS RK ЕЕЕ КЕККЕ ЕР. 


10811 带 边 界 标记 的 合并 

НЕН ӘНІН? ІНІНЕН ЕНЕ. Жа. ОҢ СЕНІ) 
F—f ERR Ао А. AALA F — IHRE RES алы ЕНЕ ЛЕНІ F — 
Tibi. ШЕН, КЕЕ us fS RES Ko F. EI МЕННІҢ 
інен. 

ІН ЕНІМ ҒЫН НЕ? xg Cm d ect. mH dee 
Wk, uH W. AARRE HH HA. ЖЕНЕН. ЕНІН free 的 时 
lp iE 533A p EMO ЕЕ RR. DU DEDERE MI ННІ РІНЕН, PE GA IEEE. 

Knuth НЫН 7 Е ОЗА НОН Е, тін Code (boundary tag)， 党 许 在 常数 时 间 内 进行 对 
前 面 霹 的 侣 并。 这 种 思想 ， 各 图 10.41 所 示 ， 是 在 钴 个 块 的 闭 尾 外 添加 一 个 黎 部 《fooler 边界 标记 )， 
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|. li HERO EH FH ERE CLARAE). 
2 剖面 的 块 是 已 分 本 和 的， 后 面 的 境 是 空 六 的， 
43， 前 面 的 块 是 空间 的 ， 而 后 面 的 培 是 已 盆 卫 的 ， 
4. WERE E HH ER E RT 
图 10.42 Bog DT sha М ЫШ е. 
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在 情况 1, АЕНА ЕСЕН. DRIFT AE, Жы d d D А, 
аКШ. TER 2 b. Supe tsi KRE, RISE NU EH UO) c RC BW 
块 的 对 邦和 后 面 块 的 车 部 。 在 情况 3 中 ， 前 面 的 块 和 当前 块 侣 并 。 用 两 个 热 大 小 的 和 来 更 新 前 面 映 
胡 头 部 和 当前 热 的 肚 部 。 在 情况 4 中， 要 合并 所 有 的 三 个 块 形成 一 个 单独 的 空间 埃 ， 用 三 个 培 太 小 
的 和 来 更 新 前 面 拨 的 头 部 和 后 面 决 的 诅 部 ， 在 睛 种 情况 中 ， 浊 并 都 是 在 常数 时 间 内 完成 的 ， 

ir Waste f RR A CE NS. 它 对 许 条 不 同类 型 的 分 配 时 和 空闲 链表 组 织 都 是 征用 的 ,然而 ， 
tiir de THEME RS. EGRE ITUR THER 43 在 应 用 程序 操作 许 密 个 小 块 时 ， 
会 产生 显 堵 的 存 铀 噬 开 销 。 例 如 ， 如 果 一 个 图 带 应 用 通过 反复 调用 malloe 和 free， 素 动态 地 创建 和 
ТЕТЕ ЖАЗЫ НІҢ ЕЕ ACH 
半 的 空间 。 

ism. d edm n Re b o bs eh E CU ER POR EE EMT. Hi 
根 一 下 , 当 我 们 试图 在 存 博 器 中 合并 当前 块 以 及 前 面 的 埃 和 后 面 的 热 时 , PUR TEUER PT ЕЕ. 
жетентеншін, m RUE ER Са Н TR RE RP I e e HL DPI A P hA 
PAM T o ENDE T. MERCIER ELA e HEIL ECL Т. Caigua. 
(ЖЕЕ. 
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10.12 58. 实现 一 个 简单 的 分 配器 

构造 一 沾 分 配器 是 一 件 富有 挑战 性 的 任务 。 宙 计 空间 腿 大 ， 有 字 科 所 格式 、 空 间 铺 表格 式 ， 以 
ТТТ ЕТТІ RAE ІІ 
АН. ИИН АННЫНАН E WWW. eE DM pA Oi ЖОШЫ. 
ШК ЕЖЕ ЕЭ UR. IEEE ЗЕ EAR EDI RT R 00. BB IFI Сач Java 2 Ж 
级 语言 的 学 生 通常 在 他 们 第 一 次 通 到 这 入 类 型 的 编程 时 ， 会 遭遇 一 个 概念 上 的 障 研 。 为 了 帮助 你 清 
除 这 个 障 而， 我 们 将 基于 隐 式 空 冰 鳃 表 ， 使 用 立即 边界 标记 个 并 方式 ， 从 头 至 尾 地 讲述 一 个 别 音 分 
А: 50. 

一 般 分 配器 设计 

我 们 的 分 配器 使 用 如 团 1043 所 示 的 memlib e 包 所 提供 的 一 个 存 娠 器 系统 枝 型 。 模 型 的 目的 在 
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于 允许 我 们 在 不 干涉 口 存在 的 系统 县 madlo 包 的 情况 卜 ， 运 行 我 们 的 分 配器 。 


шш 4-1 4" іл gH бы B2 Lr 


= ҥе 
= = 


25 


28 


30 


——— Tr 


code/vnvmemlib.c 
include "cosaps.h'"' 


/* private global variables */ 

static char *mem start Бүк; /* pomts to first byte of the heap */ 
static char *mem brk; Ї* points to last byte of the heap */ 
static char *mem max addr; — /* max virtual address for the heap */ 


ж 

* mem imt - ínitializes the memory system model 
* yj 
void mem, initíint size) 


f 


mem start БҮК = (char *)Mallocísize); /* models available VM */ 
mem brk = mem start brk; Ре heap is initially empty */ 
mem max addr - mem start, brk « size; РЕ max VM address for heap */ 


j* 
* mem sbrk - simple model of the the sbrk function. Extends the heap 
* — byincr bytes and returns the start address of the new area. In 
* this model, the heap cannot be shrunk. 
*/ 
void *mem sbrkíint incr) 
{ 
char *014 ртк = mem Бүк: 


it ( (incer < 0} |! irmem Бүк + incr} > mem max addr}} | 
errno - ENOMEM; 
return (void *}-1; 

} 

mem brk += 1пбг; 


return old brk; 


code/ym/memlib.c 
图 10.43 memlib.c: 存储 路 系统 模型 


mem init 畏 数 将 扒 可 用 的 虚拟 存储 器 模型 化 为 一 个 大 的 、 双 字 对 齐 的 字 ЕЖ. Ж 
mem start, brk 和 mem, brk 之 加 的 字 节 表 六 已 分 本 的 虚拟 存 情 器 。mem_brk 之 后 的 字 W ЖЖ tO 
的 虚拟 存 情 髓 。 分 配器 通过 调用 mem sbrk 函数 来 请 求 铬 外 的 堆 存 赃 器 ， 这 个 畏 数 和 系统 的 sbrk 8 
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数 的 接口 相同 ， 而 岂 语 义 也 相同 ， 除 了 它 会 拒绝 收缩 堆 的 请 求 。 

分 配器 包含 在 一 个 源 文件 中 “malloc,c )， 用 户 可 以 编 详 和 链接 这 个 源 文件 到 他 们 的 应 用 之 中 ， 
分 配器 输出 三 个 清 数 到 庶 用 程序 : 

1 int mm initiívaid!; 

2 void *mm mallocí(size t size); 

3 void mm freeí(void *bp): 

mm init 将 数 初 站 化 分 配器 ， 苏 果 成 功 就 返回 0， 否 则 就 返回 -1。mm_malloe 和 mm free Ж 8 
它们 对 庶 的 系统 防 数 有 相同 的 接口 和 庄 义 。 分 配器 使 用 如 图 1041 所 全 的 块 属 式 。 最 小 块 的 大 小 
5 16 1. 空间 链表 组 织 成 为 一 个 隐 式 空闲 链表 , 具有 如 图 1044 ФИ TEX Cinvariant form). 
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static char *heap límtp 
10.44 ют Н ЕШШ ETE T 

DETE- T XGEXELOS ЛЕШ АЗ 填充 后 面 紧 跟 着 -个 特殊 的 序言 块 (prologue 
Моск), Ж -个 8 字 节 的 已 分 配 块 ， 只 由 一 个 涉 部 和 -个 脚 部 组 成 。 序 言 块 是 在 宦 始 化 时 创建 的 ， 
开 晶 永 不 释放 。 村 序言 块 后 县 跟 的 是 零 个 或 者 名 个 由 malo 8 # free 调用 创建 的 普通 块 。 堆 总 是 以 
一 个 特 碟 的 结 是 块 Cepilogue block) 来 结束 ， 这 个 块 是 一 个 大 小 为 零 的 已 分 配 亿 ， 只 由 一 个 涉 部 组 
A. ГЕ ЛЕША ДЕШЕ -种 消 队 合 并 时 过 办 条 件 的 技巧 。 分 配器 使 用 一 个 单独 的 私有 【静态 ; 全 局 
变量 【heap_listp)， 沁 总 是 措 同 序言 块 .【 作 为 “个 小 优化 ， 我 们 可 以 让 它 指 同 下 -一 个 块 ， 人 而 不 是 这 
个 夺 言 块 ,) 

操作 衬 闲 链表 的 基本 常数 和 宏 

图 10.45 展示 了 一 些 我 们 在 分 配器 编码 中 将 监 使 用 的 基本 池 数 。 


CCC 一 


code/vm/mallac.c 


1 /* Basic constants and rnacros */ 

2 define WSIZE 4 /* word size (bytes) */ 

3 #define DSIZE 8 /* doubleword size (bytes) *! 
4 "define CHUNKSIZKE (1<<12) 上 initial heap size (bytes) */ 
5  ЖдеРіле OVERHEAD 8 /* overhead of header and footer (bytes) */ 
b 

7 fdefine MAX(x, y) tix) > (y)? (x) : ТҰР) 

Б 

9 f* Pack a size and allocated bit into a word */ 

lt define PACK(size, allec} ((size) | (alloc)) 

11 

12 


/* Read and write a word at address p */ 
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13  £deline СЕТ(р) (*(size t *#*)(р)) 

14 tdefine РІЛір, уа.) (*(size t *)ip) = (уа1)) 
15 

16  /* Read the size and allocated fields from address p */ 

17  $define GET SIZEÍip! (СЕТ ір) & -0х?) 

lt tdefine GET ALLOCÍD) (GET(D) & Uxl) 


15 
2t — f* Given block ptr bp, compute address of its header and footer */ 


21 +#define HDRP (bp) [(char *)(bp) - WSIZE) 
22 detine FTRP(bp) (ichar *) (рр) + GET SIZE(HDRP(bp)] - DSIZE) 
23 


24 А Given block ptr bp, compute address of next and previous blocks */ 
25 #define NEXT BLKP[ bp) (ісһат *)(bp) + GET SIZE(([(char *) (bp) - WSIZE))] 
26  4define PREV BLKP[bp) (ichar *)(bp) - GET SIZE(((char *) (bp) - DSIZE)]! 
— — —————————————————————————————— ————  codefym/mülloc.c 
10.45 ”操作 空闲 链表 的 基本 常数 和 宏 


第 2 一 5 行 定 义 了 一 些 基 本 的 大 小 常数 ， 字 的 大 小 【WSIZE) 和 双 字 的 大 小 【DSIZE)， 初 始 空 
闲 块 的 大 小 和 扩展 堆 时 的 默认 大 小 《CHUNKSIZE)}， 以 及 涉 部 和 脚 部 占用 的 开销 字 节 数量 
(OVERHEAD). 

在 空闲 链表 中 操作 头 部 和 脚 部 串 能 是 很 麻烦 的 ， 因 为 它 要 求 大 量 使 用 强制 类 型 转换 利 指 镍 还 
算 。 因此， 我们 发现 定义 一 个 小 的 宏 的 集合 来 访问 和 遍历 空闲 链表 是 很 有 帮助 的 (第 10726 172. 
PACK X {第 10 行 ) 将 大 小 和 已 分 配 他 结合 起 来 ， 并 返回 -个 值 ， 可 以 把 它 存放 在 头 部 或 者 脚 部 
F, 

GET Ж (第 13 行 ) 读 取 和 返回 参数 p 引用 的 字 。 这 里 强制 类 型 转换 是 至 关 重要 的 。 参 数 p X 
型 地 是 一 个 (viod *) 指针 ， 不 可 以 直接 进行 间接 引用 。 类 人 己 地 ，PUT 宏 〈 第 14 行 ) 将 val EXE 
参数 p 指 阿 的 字 中 ， 

GET SIZE 和 GET ALLOC 宏 (第 17 一 18 行 ) 从 地 址 p 处 的 头 部 或 者 脚 部 ， 分 别 返 回 大 小 和 
已 分 配 位 。 剩 下 的 宏 是 对 块 指针 《block pointer, A bp 表示 》 的 操作 ， 伟 指针 指向 第 一 个 有 效 载 从 
字 节 。 给 定 一 个 块 指针 bp，HDRP 和 ЕТЕР Ж CE 21—22 行 ) 分 别 返 思 指向 这 个 块 的 头 部 和 胸部 
的 指针 。NEXT_BLKP 和 РЕЕУ BLKP 3: (第 25—26 fr) 分 别 返 回 指向 后 面 的 抉 和 前 面 的 块 的 块 
指针 。 

可 以 以 多 种 方式 来 编辑 宏 ， 以 操作 字 闲 链表 。 比 如， 给 定 一 个 指 问 当 前 块 的 指 填 bp， 我 们 可 以 
使 用 下 面 的 民 妈 行 来 确定 存 鳍 器 中 后 面 的 正 的 大 小 : 

size_t size = GET SIZE(HDRP(NEXT BLKPi(bp))); 

"ЕРІНЕ 

在 调用 тип malloc 或 者 mm, free 之 前 ， 应 用 必须 通过 调用 mm init d Eod be :参见 图 
10,46). 


code/vm/malloc.c 
1 int mm  init(void) 





642 $103 
2 1 
3 J create the initial empty heap */ 
4 t ((heap listp = mem sbrk(éá*WSIZE)) == NULL) 
б return -1; 
6 PUT(heao listp, 0); /* alignment padding */ 
7 PUT (heao listp»WSIZE, PACK(OVERHEAD, 1));  # prologue header */ 
8 PUT(heap listp«DSIZE, PACK(OVERHEAD, 1)); /* prologue footer */ 
9 РОТ (пеар listp-»WSIZE«DSIZE, РАСК(0, 11); i* epilogue header */ 


10 heap, listp += DSIZE; 


11 

12 /* Extend the empty heap with a free block of CHUNKSIZE bytes */ 
13 if (extend heap(lCHUNKSIZE/WSTZE,; == NULL) 

14 return -1; 

15 return 2; 

le ] 


Е ecode/vm/malloc.c 
Bj 10.46 mm. init: 创建 一 个 带 初始 衬 闲 块 的 堆 

mm init 函数 从 存储 器 系统 得 到 4 个 字 ， 并 将 它们 初始 化 ， 从 市 创建 ”个 空 的 空间 链表 ( 弟 4 一 
10 行 )。 然 后 它 调用 extend heap Ж ОЖ 10.47)， 这 个 阴 数 将 堆 扩 展 CHUNKSIZE 7 全， 并 二 创建 
审 始 的 空间 块 ， 此 刻 ， 分 配器 已 初始 化 了 ， 并 且 准 备 好 接受 来 自 应 轩 的 分 配 和 释放 请 求 。 


— —. code/vnymallac.c 
1 static void *extend heapísize t words] 
2 { 
3 char *bp; 
4 size_t 517Є; 
5 
5 /* Allocate an even number of words to maintain alignment */ 
7 size s words % 2) ? (wordse4s1) * WSIZE : words * WSIZE; 
a i£ f(intli(bp = mem sbrkísize)j) < 0! 
9 return NULL; 
10 
11 六 Initialize free block header/footer and the epilogue header */ 
12 PUT(HDRPibp), PACKi(size, 09); /* free block header */ 
13 РОТ {ЕТЕР(Бр), PACK(size, 0}\; /* tree block footer */ 
14 PUT[HDRP(NEXT BLKPíbp])), PACKIO, 11); /* new epilogue header */ 
15 
26 Ж Coalesce if the previous block was free */ 
17 retLurn coalesceibDp:: 
18 } 


——rF —————————————— — — — — vodejvm/maltiuc.c 


图 10,47 extend heap: 用 一 个 新 的 空闲 块 扩展 堆 
extend heap 蝴 数 会 在 两 种 不 同 的 环境 中 被 调用 ;号 当 堆 被 初始 化 时 ， 凶 半 mm malloc 不 能 找 
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到 个 合适 的 此 配 块 时 。 为 了 保持 对 齐 , extend_heap AERA DAERA ARER 257 C8 iy) 
的 倍数 ， 然 后 向 存储 器 系统 请 求 额外 的 扒 室 间 《〈 第 ?了 -9 行 )。 

extend heap ИННИ ЕН» (第 12—17 行 ) 在 某 些 方面 是 很 细微 的 。 雁 开始 于 一 个 避 宇 对 齐 
的 边 异 ， 并 每 次 对 extend heap 的 调用 部 返 凹 一 个 拱 ， 该 换 的 大 小 是 双 字 的 整数 倍 。 国 此 ， 对 
mem_sbrk 的 每 次 调用 都 返 岂 个 双 字 导 齐 的 存 铺 器 组 块 (chunk)， 紧 跟 在 结尾 块 的 头 部 后 面 。 这 个 
头 部 变 成 了 新 的 空 闪 块 的 头 部 (第 12 行 ), 并 且 这 个 组 抉 (chunk》 的 墩 后 一 个 字 变 成 了 新 的 结尾 块 
的 头 部 (第 14 行 )。 最 后 ,在 很 可 能 出 现 的 前 一 个 堆 以 一 个 空闲 块 结束 的 情况 中 ,我 们 调用 coalesce 
请 数 来 合并 两 个 宅 用 块 ， 并 返回 指向 合并 后 的 抉 欧 块 指针 (#1717). 


Hi RIS FB 


点 用 通过 调用 mm, free ЕЖ 《图 10.48》， 来 释放 一 个 以 前 分 配 的 块 ， 这 个 函数 释放 所 请 求 的 块 
tbhp)， 然 后 使 用 10.9.11 节 中 描述 的 边界 标记 合并 技术 将 之 与 邻接 的 空闲 块 侣 并 记 来 。 








void тт Ггееіусій *рр) 


{ 


} 


size_t size = GET 51?Е{НРЕР{рр!}; 


PUTIHDRP(bp), PACK(size, 07): 
PUTiFTRP(bp), PACK(size, 01); 
coalescetbp): 


static void *coalesce(void *bp) 


{ 


size_t prev alloc = GET ALLOC(FTRP(PREV BLEP(b2)]): 
size t next alloc = GET ALLOC(HDRP(NEXT BLKP(b2)]) 
size t size = GET SIZEIHDRP(bp)); 


F 
F 


if (prev alioc ва next allocy I£ /* Case ] */ 
return bp; 


) 


else ІР (prev alloc sk lnext alloc) 1 i* Case 2 */ 
size += GET SIZE(HDRP(NEXT BLKP(bp))): 
PUT(HDRP(bp), PACK Size, 0)); 
PUT(FTRP(bp), PACKisize,0]); 
returnibp!: 


elso if i!prev alloc && next alloc) 1 /* Case 3 */ 
кізе += GET SIZE(HDRP(PREV. BLEP (bp) ) ) ; 
РОТ (ЕТКР(Бр), PACKisize, 2)); 
PUTiHDRPIPREV BLKP:bp)), PACK[size, 0j); 


— n O code/vim/malloc.c 


644 % 10% 


31 return/PREV БКР( Бр! }; 

32 } 

33 

^d else | Ж Case 4 ҰЯ 
35 gize += СЕТ_517®Ю{НОВР{(РНЕУ_ВЬЕР{Ьр},) + 
36 GET SIZE(FTRP(NEXT BLXPibp))]: 

37 PUTIHDRP(PREV BLKP(bp))?, PACKisize, 01): 
38 PUTIFTRP(NEXT BLKP[bp)), PACKIsize, 0j); 
39 return(PREV BLKP(bp]l); 

40 ) 

41 ] 


code/vm/malloc.c 
图 10.48 mm free: 释放 一 个 块 ， 并 使 用 边界 标记 合并 将 之 与 
所 有 的 邻接 空闲 二 在 常数 时 间 内 合并 起 来 


coalesce r& Ж]! fA ДЕК 10.42 中 汉 画 的 四 种 情况 的 :种 简单 丰 接 的 实现 方式 ,这 时 也 有 些 细 
微 的 方向， 我 们 选择 的 空闲 链表 格式 一 一 它 的 序言 块 和 结尾 块 总 是 标记 为 已 分 配 一 一 允许 我 们 忽 路 
湾 在 的 抹 烦 边界 情况 , 也 就 是 , iski bp 在 堆 的 起 始 处 或 者 是 在 堆 的 结尾 处 。 如 里 没有 这 些 特 妹 块 ， 
КЕНЕНІ, ЕЛАЯНЫ. FLER HARTA ККЕ АЛЕН. ЕМЕ 
Ar T8 ТА Р ЭН. 

Ли 

个 应 用 通过 谢 用 mm  malloc ЕЖ СР 10.49) ЖЕТЕ ЕК КА size FERR. ҮЕ 
ЖААК Ла (8-0 47), ABRE RECORDAR. Mam A CORR RS ma). Л 
满目 双 字 对 漠 要求。 第 12~13 行 强制 了 最 小 块 大 小 是 16 FE: 8 字 节 (DSIZE) ПЖ ЕЗ 
X. d^ 8^ (OVERHEAD) 出 来 放 头 部 和 了 肚 部 。 村 于 超过 8 字 节 的 请 求 【 第 15 人行?)， ЖЫ 
则 是 加 上 开 渍 娃 安 ， 然 后 向 上 省 入 到 量 接近 的 名 的 整数 倍 (DSIZE)。 


—n .——- — 





code/vm/malloc.e 


1 võid “пі, mallocí(size t size) 

2 { 

3 Size t asize; i* adjusted block size */ 

d size | extendsize;  /*amountto extend heap if no fit */ 
2 char *bp; 

Б 

7 


Ї* [gnore spurious requests */ 
H 15 (size <= 1) 
g return NULL; 


10 

11 /* Adjust block size to include overhead and alignment reqs. */ 

12 if [sive <= DSIZE] 

13 авіуе = DSiZE + OVERHEAD; 

14 else 

15 авіге = DSIZE * {{size + (OVERHEAD) + (DSIZE-1)) / DSIZE); 
16 


17 /* Search the free list for a fit */ 


18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 


虚拟 存储 器 645 


if ((bp = find fití(asize)) != NULL) 1 
placeíbp, asize!; 
return bp: 

} 


/* No fit found. Get more memory and place the block */ 

extendsize = MAX(asize,CHUNKSIZE); 

if ((bp = extend heapiextendsize/WSIZE)) == NULL) 
return NULL; 

place {bp, asize); 

return bp; 


code/vm/malloc.c 


图 10.49 mm malloc: А З а 


' 旦 分 配器 调整 了 请 求 的 大 小 ， 它 就 会 搜索 空闲 链表 ， 寻 找 一 个 合适 的 空闲 据 《 第 18 行 )。 如 


果 有 合 短 为 ， 那 么 分 配器 就 放 彤 这 个 请 求 块 ， 并 有 选择 地 分 制 出 多 余部 分 【第 19 行 )， 然 后 返 区 新 
分 配 块 的 地 址 【第 20 行 )。 

ШЕЛ as АВЕ В А В, ЖАНЕ ТКИ ЖА KH 【第 24226 17), 把 
ШКАЛА ГАЈЕ ЕЕ, BXRHOU MEX I 《第 27 行 )， 然 后 返回 一 个 指针 ， 指 癌 这 个 
新 分 配 的 块 《 第 28 行 )。 

练习 题 10.8 

为 10.9.12 节 中 描述 的 简单 分 配器 实现 一 个 find. fit 函数 。 

static void *find fit(size t asize) 


RESTER IV DOR] BAUR GER DT B CORRER. 


练习 题 10.9 
为 示例 的 分 配器 编写 一 个 place 函数 。 
static void placeívoid *bp, size t asize) 


ARTE ELCHE КОЖЕ ET IR ped Ж. АЖ SG qe 69 k HE SUEDE IG 
的 大 小 时 ， 才 进行 分 制 ， 


10913 显 式 空闲 链表 

隐 式 空 亲 链表 为 我 们 提供 了 -种 简单 的 介绍 一 些 基 本 分 配器 概念 的 方法 。 然 而 ， 因 为 专 分 配 与 
淮 块 的 总数 时 线性 关系 ， 所 以 对 于 通用 的 分 配器， 降 式 空闲 链表 是 不 适合 的 【尽管 对 十 推 块 数量 预 
先 就 知道 是 很 小 的 特殊 的 分 配器 来 说 ， 它 是 比较 好 的 )。 

一 种 更 好 的 方法 是 将 空闲 块 组 织 为 某 种 形式 的 显 式 数据 结构 。 因 为 根据 定义 ， 程 序 是 不 需 监 一 
个 空 亲 块 狼 主 体 ， 所 以 实现 这 个 数据 结构 的 指针 可 以 存放 在 这 些 空 亲 换 的 主体 曲面 。 例 如 ， 堆 可 以 
组 织 成 一 个 双 回 宝 闲 链表， 在 每 个 空闲 抉 中 ， 痢 包含 一 个 pred ОН) 和 succ (后 对) 指针 ， 如 图 
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31 321% 31 4210 


ik A F. ай X 
i pred СЯ. > 
succ (ДФ) 


Ab 








4 393848 原来 的 有 效 载 和 
填充 《可 选 ) 
块 人 小 | g | ИЖ 





(а) rR HL tb》 空闲 块 
图 10.50 使 用 双向 空 霜 链表 的 扒 块 的 格式 


司 用 双 癌 链表 ， 而 不 是 隐 式 空 亲 链表， 使 首次 适 权 的 分 配 时 间 从 块 总 数 的 线性 时 间 减 少 到 了 空 
ARA UAR TER TS]. ARId. ЖОҚ “个 块 的 时 间 可 以 是 线性 的 ， 也 可 能 是 个 向 数 ， 这 取决 于 我 们 在 
ИНЕ НМ ЕТ ЙЫҚ Ы. 

一 种 六 法 是 用 后 进 先 出 【LJFO) 的 顺序 维护 链 去 ， 将 新 释放 的 块 放 置 在 链 者 的 开始 处 。 使 用 
LIFO 的 顺 太 和 首次 下 配 的 放 宣 策略 ， 分 配 圳 会 最 先 检 直 最 近 司 用 过 的 块 。 在 这 种 情况 下 ， 释放 -个 
据 可 以 在 荣 涩 时 间 内 完成 。 如 果 使 用 了 边 办 标记， 那么 人 台 并 也 可 以 在 常数 时 间 内 究 成 。 

力 “ 种 方法 是 按照 地 址 顺序 来 维护 链表 ， 其 中 链表 中 每 个 块 的 地 址 都 小 于 它 祖 先 的 地 址 。 在 这 
种 情况 下 ， 释 攻 一 个 块 需要 线性 时 间 的 搜索 ， 来 定位 合适 的 祖先 。 平 衡 点 在 于 ， 按 有 照 地 址 排 岸 的 首 
WARE LIFO 持 序 的 许 次 适 配 有 更 高 的 存储 器 利用 率 ， 接 近 最 件 适 配 的 利用 率 。 

ARM PARKRA TTW ДД А, MESNE REMEE, MALALA AEN 
Нн. ХАНЫ ERR RAD. ТБ ТЕҢДЕШ р. 


10.9.14 ”分离 的 空闲 链表 

m Dl П, “个 使 用 单 向 空闲 块 链表 的 分 配器 需 昌 与 空闲 块 数量 成 线性 关系 的 时 间 
来 分 肥 块 。 一 种 流行 的 减少 分 配 时 间 的 方法 ， 脖 党 称 为 分 离 存储 〈segregated storage)， 维 护 多 个 空 
内 链表 ， 其 中 每 个 链表 中 的 块 有 大 禾 相 等 的 大 小 。 

一 般 的 思路 是 将 所 有 可 能 的 块 大 小 分 成 ЭЕ ОЕ, {БШ Х.Р Ж Cize class)。 有 很 多 种 方式 
KEXAK йі, БАЛАН ОН ЖИ Ko 

1), 02), 13,4), 15 81, [1025-2048], [2049-4096], 14097 ee] 
"ҰЙ ПП МИН ШЕТІН e AERE, ПЕЛІМЕН2 pt Ж: 
{1}, 21. 03.77 {1023}, {1024}, 7, {1025-20481, 
( 2049-4096], 14097--о! 

分 配器 维护 省 一 个 空闲 链表 数组 ， 每 个 大 小 类 一 个 空 用 钾 表 ， 技 照 大 小 的 升序 排列 。 当 分 配器 
市 坚 一 个 大 小 为 5 的 块 时 ， 它 就 搜索 相应 的 空闲 链 表 。 如 时 它 不 能 找到 合适 的 块 与 之 此 可， 它 就 者 
索 下 一 个 链表 ， 以 此 类 推 。 
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в Кб M ЕЛЕЙ ТН P ВАБ, ЕНЕ ENTE X K 28, 
METAF. ЕРЕ ИА КИНО NET RSS. ЖАЛЫНЫ, WX. IWON TEK 
哪些 可 能 性 ， 我 们 会 描述 两 种 基本 的 方法 ， 简 单 分 离 存储 (simple segregated storage) 和 分 离 运 配 
{segregated fit). 


简章 分 离 存 赃 

使 用 简单 分 离 存 侍 ， 每 个 大 小 类 的 空 闹 链 表 包 会 天 小 由 等 的 过 ， 每 个 决 的 大 小 就 是 这 个 入 小 类 
中 最 入 元 娄 交 大小。 例如， 如 果菜 个 大 小 类 定义 为 {17-32}， 那 么 这 个 类 的 室 闵 链表 全 由 太 小 为 32 
的 块 组 成。 

为 了 分 配 - -个 给 定 太 小 的 块 ， 我 们 检查 相应 的 罕 闲 链表。 如 果 链 表 非 于， 我 们 简单 地 分 配 其 中 
第 一 块 的 全 部 。 容 闲 块 是 不 会 分 出 以 福 足 分 配 请 求 的 。 如 果 链 表 为 定 ， 分 配器 诚 向 操作 系统 请 求 一 
个 固定 大 小 的 额外 存 情 器 组 块 (BUM ME vom AG BUSES, SIX TRE (chunk) 分 成 太 小 相等 
В, НЕВИНЕН ОНЕ. ЕВИ -个 块 ， 分 配器 只 要 简单 地 将 这 个 块 插 入 到 
相应 的 空 亲 链表 的 前 部 。 

这 种 简单 方法 有 许多 优点 。 分 配 和 释放 块 都 是 很 快 的 常数 时 间 操 作 。 而 且 ， 每 个 组 据 (chunk) 
中 都 是 大 小 相等 的 块 ， 不 分 割 ， 不 合并 ， 这 意味 着 每 个 挟 只 有 银 少 的 存储 器 开销 。 既 然 每 个 组 块 只 
有 大 小 相同 遇 眶 ， 那 么 一 个 已 分 配 丝 的 大 小 就 可 以 从 它 前 地 址 中 推断 出 来 因为 没有 合并 ， 所 以 已 
ЖЕЛЕ А АТЫН ТЕЗ а. КЕБЕ ЕН, БЫНАН а Ы ЕН 
ЖӘЕ. КДЛЫП КЕКЕ ЖЕДЕ E ЕДИП ЕП AR ERE, ВЕБЕ е HS dE EA ЫНЫ, ІП 
不 用 是 双 四 的 了 ,关键 点 在 于 , E- EEk EIE BUS SET TER Beh — EH) succ 指针 ， 
因此 最 小 块 大 小 就 是 一 个 字 ， 

一 个 显著 的 缺点 是 ， 简 单 分 离 存储 很 容易 造成 内 部 和 外 部 碎片 。 国 为 空闲 块 是 不 会 被 分 市 的 ， 
所 以 可 能 会 造成 内 部 碎片 。 更 糟 的 是 ， 某 些 引 用 模式 会 引起 极 多 的 外 部 碎片 ， 因 为 是 不 会 合并 空闲 
块 的 (练习 题 10.10). 

研究 者 提出 了 一 种 粗粮 的 合并 形式 来 对 村 外 部 碎片 问题 。 分 配器 记录 操作 系统 返回 的 每 个 存 慷 
ІК (chunk) 中 的 空 闻 志 的 数量 。 无 论 何 时 ， 如 果 有 一 :个 组 块 完全 出 空 用 块 组 成 ， 那 么 分 配器 就 
内 它 的 当前 天 小 类 中 删除 这 个 组 块 ， 鸽 得 它 对 其 他 大 小 类 可 用 。 


ЭШ 10.10 

描述 一 个 在 基于 简单 分 离 存 储 的 分 配器 中 会 导致 严重 外 部 碎片 的 引用 模式 ， 

^r ЈАК 

使 用 这 种 方法 ， 分 配器 维护 着 一 个 空闲 链表 的 数组 。 每 个 空闲 链表 是 和 一 个 大 小 类 相关 联 的 ， 
并 有 被 组 织 成 某 种 类 型 的 显 式 或 隐 式 链表 。 每 个 链表 包含 潜在 的 大 小 不 同 章 块 ， 这 些 块 的 大 小 是 大 
小 美的 威 员 。 有 许多 种 不 同 的 分 离 适 配 分 配器 。 这 里 ， 我 们 描述 了 一 种 简单 的 版 本 。 

为 了 分 配 一 个 块 ， 我们 必须 确定 请 求 的 大 小 类 ， 并 及 对 适当 的 空闲 链表 做 首次 运 甬 ， 坦 找 - 个 
合适 的 块 ， 如 果 我 们 找到 了 一 个 ， 那 么 我 们 《可 选 地 ) 分 割 它 ， 并 将 剩余 的 部 分 插入 到 适当 的 空闲 
链表 由。 如果 我 们 找 不 到 合适 的 块 ， 堵 么 我 们 就 搜索 下 一 个 更 大 的 大 小 类 的 室 亲 链表。 如 此 重复 ， 
直到 找到 一 个 台 适 的 块 ， 如 果 设 有 空闲 链表 中 有 合适 的 块 ， 那 么 我 们 就 向 操作 系统 请 求 额外 的 堆 存 
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侦 上 器， 从 这 个 新 的 堆 存储 器 中 分 配 出 一 个 块 ， 将 剩余 的 部 分 放 收 在 最 大 的 天 小 类 中 。 些 释放 - DA, 
我 们 执行 台 并 ， 并 将 纺 果 放置 钊 相应 的 空 用 链表 中 。 

分 岗 适 配方 法 是 一 种 前 见 的 选择 ，& 标准 库 中 提供 的 GNU maloe 包 就 是 米 用 的 这 种 方法 ， 因 
为 这 和 方法 始 快 速 ， 央 人 存 悄 路 的 使 用 也 很 有 效率 。 搜 索 时 疝 碱 少 了 ， 画 为 搜索 被 限 删 在 扒 的 某 个 部 
ЙКЕ ЖЕН. 存储 器 利用 率 得 到 了 改善 ， 内 为 有 一 个 有 趣 的 事实 ;对 分 离 空闲 链 表 的 简单 的 
自 次 适 配 搜索 机 当 寺 对 区 个 堆 的 最 住 适 配 搜索 。 

伙伴 系统 

КАР S (buddy system? 是 双 离 匹配 的 一 种 特例 ， 其 中 每 个 大 小 类 都 是 2 的 振 。 基 本 的 加 路 
是 假 没 一 个 维 的 大 小 为 2" 个 字 ， 我 们 为 每 个 块 人 小 维护 一 个 分 离 空 用 链表 ， 其 中 <k<m。 请 
求 顽 大 小 加 上 舍 入 到 最 接近 的 寺 的 属 。 报 开始 时 ， 只 背 一 个 大 小 为 2 个 字 的 空 亲 块 。 

为 了 分 配 一 个 大 小 为 2 的 块 ， 我 们 找到 第 一 个 可 用 的 、 大 小 为 内 的 块 ， 其 中 <j<m。 ШЖ = 
k, WARMA. 人 则 ， 我 们 递归 地 二 分 这 个 块 ， 玫 到 了 = 大。 当 我 们 进行 这 样 的 分 烛 时 ， 每 个 
#L F 3931 (也 叫做 伙伴 )， 被 放置 在 相应 的 空闲 链 才 中。 整 释 放 一 个 人 小 为 2 的 块 。， 我 们 继续 合 
并 空 亲 的 伙伴 。 当 我 们 遇 到 一 个 已 分 配 的 伙伴 时 ， 我 们 就 停 小 合并 。 

关于 伙 作 系统 的 “个 关键 事实 挟 ， 络 定好 址 和 抉 的 大 小 ,很 容易 计算 出 它 的 伙伴 的 地 址 。 例如 ， 
“АМЕ, ААУ 32 70, МАҢ: 

XxX..xü00gu 

它 的 伙伴 的 地 址 为 

ххх..х1П000 
换 名 话说， -个 块 的 更 趟 和 它 的 伙伴 只 有 一 位 不 相同 。 

伙 什 系统 分 想 器 前 主要 优点 是 它 的 快速 牟 索 和 快速 合并 。 主 要 缺点 是 要 求 块 大 小 为 2 ЖАНЕ 
也 狼 亚 涯 的 内 部 禁片 。 内 此 ， 炙 伴 系 统 分 配器 不 适合 通用 自前 的 了 上 作 负 载 ， 然 而 ， 对 于 革 些 与 应 用 
相交 的 工作 负载 ， 其 中 央 大 小 预先 知道 是 2 у, КРЕТАО АЕ АТЗ ЛТ. 


1040 垃圾 收集 


ЇЛЇШ C malloc 包 这 样 的 显 式 分 配器 中 ， 应 用 通过 调用 malloc 和 free ЖЕЛЕ НЫН. A 
Ел АМАН ЖЕК ӘНЕ. 

A BERE ILL. 5p BOTHE IE — Fk А АА я, ЖШ, ЖЕ ЕШКІ С РАЙ. EDS ЕНН — 07), 
ЕА — Be ТЕ: 


1 vola garbage {) 
9 ! 
3 іл *» = iint *;Malloc(15213); 

1 

5 return; Ё array pis garbage at this point */ 
b } 


КАЕН ЛУН p， 所 以 在 garbage 返回 前 应 该 释放 p. ЖӘНЕ, БЕЛ ВОКА, 
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ЕЛЕЙ ЛЕ ЧЕ BINE ЖИККЕ A ЕЛ ААҖ. ЕХЛЕН k E ЖЖЖ ЛИН ЖИА ЈА ЕТ АСТ АЈ 
堆 空 间 。 

垃圾 收集 器 (garbage collector) 是 一 种 动态 存储 分 配器 , 它 自动 释放 程序 木 再 需 此 的 已 分 配 块 。 
АА АНА (garbage), UR GREC CA ERR. ПАНЫ Er f Ri) c Re Bu ic ЖҚ 
Ж (garbage collection), КВНЕ АЯН, МУНИ ДОУ, PENTE ШЛУ 
ЇЇ, CET ЕРЭН, РУН malloc， 但 是 从 不 调用 free. ЮП ffe. Iq D 
期 识别 垃圾 块 ， 并 相应 地 调用 бее, ЖЕРІНІҢ ЖЕН. 

TRR GEWE] John McCarthy 在 20 世纪 60 年 代 早 期 在 MIT ЖЕМ Lisp 系统 , 它 是 详 如 
Java. ML. Perl 和 Mathematica 等 现代 语言 系统 的 TEENS. АЕК TREES 
Bh. ВУХ Г ХЕШЕ, HERES Amm. БЛІКМІПӘБЕР MeCarthy 独创 的 
Mark&Sweep (HARRO 算法 ， 这 个 算法 很 有 趣 ， 因 为 它 可 以 建立 在 已 存在 的 maloe 包 的 基础 
ZE, 23 C 和 C++ 程序 提供 垃圾 收集 。 


10.10.1 垃圾 收集 器 的 基本 要 素 

培 蜂 收集 器 将 存 情 器 珊 为 - 张 有 向 可 达 图 (reachability graphy， 其 形式 如 图 10.5) ЖЖ. wid 
的 节点 被 站 成 一 组 根 节 点 (root node). 81— 238 i,t Cheap node)。 每 个 堆 生 点 对 应 十 卉 中 的 -个 己 
A EGER. HER p = а ERAR p 中 的 某 个 位 置 措 问 块 q 中 的 某 个 亿 置 。 根 市 点 对 应 于 这 样 种 不 
在 堆 中 的 位 轩 ， 它 们 中 包含 指向 推 中 的 指针 ， 这 些 位 置 可 以 是 寄存 器 ， 栈 里 的 变量 ， 或 者 旺 虚 拟 存 
情 器 中 读 写 数据 区 域内 的 全 局 变量 ， 





图 10.51 二 级 收集 器 将 存储 器 视 为 一 张 有 喘 图 


当下 在 一 条 从 任意 根 节 点 出 发 并 到 达 p 的 有 向 路 径 时 ， 我 们 说 -个 节点 p 是 可 达 (reachable). 
在 任何 时 刻 ， 和 垃圾 相对 应 的 不 可 达 节 点 是 不 能 被 应 用 再 次 使 用 的 。 垃 圾 收集 器 的 角色 是 维护 可 达 
图 的 某 种 表示 ， 并 通过 释放 不 可 达 节 点 并 将 它们 返回 给 空闲 链表 ， 来 定期 地 思 收 它们 。 

像 ML 和 Java 这 桩 的 语音 的 垃 级 收集 器 ， 对 应 用 如 何 创建 和 使 用 指针 有 很 直 格 的 控制 ， 能 够 维 
扩 可 这 图 的 一 各 精确 的 表示 ， 国 此 也 就 能 够 回收 所 有 境 最 。 然 而 ， 诸 如 C 和 和 ++ 这 样 的 语言 的 收集 
厂 通 单 不 能 维持 可 这 图 的 精确 表示 。 这 样 的 收集 器 也 叫做 保 字 的 垃圾 收集 器 (conservative garbage 
collector)。 人 只 茶 种 意义 上 来 说 它们 是 保守 的 ， 世 就 是 ， 每 个 可 达 块 都 被 正确 地 标记 为 可 达 了 ， 而 -- 
些 不 可 这 节点 却 可 能 被 错误 地 标记 为 可 达 。 

收集 器 可 以 按 需 提供 它们 的 服务 ， 或 者 它们 可 以 作为 一 个 和 应 用 并 行 的 独立 线 税 ， 不 断 地 更 新 
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В] A Ba ПН bu ІП, Ж cedi c fa CEFE- TF DAT BE SE ПА P| EVE EB) maho Ah, 
如 图 10.52 Pra . 


C z [POPE 


10.52 РАУ А 8]— С BJ тойос 包 中 
AV e IE pH S ЖЕҢЕ РН, А IS АЛЕН malloc. ШИЕ malloc 找 不 到 一 个 合适 的 
THR, HA ЛНА АЛАН Ы, Н ВЕ рр EREET ЖЫК. ЫНАН АА, JF 
通过 调用 free 前 数 将 它们 返回 给 堆 。 关 键 的 想法 是 收集 器 代替 应 用 去 调用 free, ЧЕК E А 
АМ, malo 重 试 ， 斌 图 此 现 -- 个 合适 的 空 朵 块 。 如 果 还 是 失败 了 ， 那 么 它 就 会 同 操 作 系 统 要 求 
矣 外 的 存储 器 。， 最 后 ，mallee 返回 一 个 指向 请 求 庆 的 指针 《如果 成 功 ) 或 者 返回 一 个 空 指针 【如 果 
АДЫ), 


10.10.2 Mark&Sweep 垃圾 收集 器 

Mark&Sweep 垃圾 收集 器 庄 标 记 ( mark ) 阶段 和 清除 ( sweep) 阶段 组 成 。 标 记 阶 段 标记 出 根 节 
战 的 搞 有 可 过 的 和 已 分 配 的 后 继 ， 而 后 面 的 清除 阶段 释放 每 个 未 被 妹 记 的 已 分 配 块 。 上 典型 地 ， 块 水 
部 中 空 用 和 芍 低 位 中 的 一 个 用 来 表示 这 个 氛 是 否 被 标记 了 。 

找 们 对 Mark&Sweep 的 描述 将 假设 使 用 下 列 函 数 ， 其 中 pr q: Х 2) typedef char “рі: 

e pir isPtr (ptr p: ЖЖ р АЛАН ЕКЕ, ЖАШЫ SERI TI 

Pe B fE £| b. SERI NULL. 

• intblockMarked(ptr b); ШЖ с за ГЬ, ЯА ЈА гое. 

е іп blockAllocated(ptr b): 如 果 块 b 是 已 分 配 的 ， 那 么 就 返回 іше, 

е void markBlock(ptrb);: Fri IR b. 

e intlength(): EPH b ТЕ СЕЗСЕН), 

* void unmarkBlock(ptr b): 将 抉 b 的 状态 由 已 标记 的 疏 为 未 标记 的 。 

» ptrnextBlock(ptrby: 返回 堆 中 抉 b 的 后 继 。 

标记 和 阶段 为 每 个 根 季 点 调用 一 注 图 10.53 Са) 所 水 的 так ЖШ. 如果 p Aie- МН. 
Н ЖАШ. mark eR ЯУ BOR IL. И, ША Мі, ЖИН Ф SP ОДИН МИЕ НГЕ 
BO. 每 次 对 mark 函数 的 调用 都 标记 某 个 根 节 点 的 所 有 未 标记 并 且 可 达 的 后 继 节 点 。 耕 标记 阶段 
的 栗 尾 ， 尾 何 末 标记 的 已 分 配 块 都 被 认定 为 是 不 可 达 的 ， 是 垃 最 ， 可 以 在 清除 阶段 思 收 。 

清除 阶段 是 对 图 10.53 (b) 所 未 的 sweep ВАС 次 调用 。sweep ТНА Е 
环 ， 拜 放 它 所 过 到 的 所 有 未 标记 的 已 分 配 块 (也 就 是 垃圾 )。 


void markiptr р) Í 


жалалы 


пос | | frio : 
mane aa | | 








15 [(b = isPtrlp)) == NULL! vo:d sweeolptr b, рсг end) í 
return; while ib < епа} í 
if (blockMarkedib)!] lf [blockMarkediLk!) 


E NES 65! 


return; unmarkBlock ib); 
WmarkBlockib!: else if (blockAllocatedib)] 
len = lengtaiíh); freeí(Db!; 
for 11=0; i < len; i++} = nextBlockíb); 
mark(bfil]): ] 
return; return; 


! } 
Ж 10.53 mark 和 sweep ir fts 
图 10.54 Ro T “РНЕ Mark&Sweep ИЕ. Tal Eak OR. БААУ 
FERRETA 4x. МАН SF BL, SE Z Ebru, ТН. 要么 是 未 标记 的 。 
Ront 


рб 
V 


标记 前 : 








| BELL 


gc c 





TER BU: 


— e Dr 
V 


10.54 “标记 和 清除 示例 
DECR Н НСВ X Aor EE АОН. т ВЕНЕ, 

初始 情况 下 ， 图 10.54 ОН ТЕН, ДР КИДЕ УЕ. 28 3 块 包含 -- 
个 指向 第 1 块 的 指针 。 第 4 0643813 3 GRUB 6 快 的 指针 。 根 指向 第 4 块 。 在 标记 阶段 之 后 
第 1 块 、 第 3 决 、 第 4 块 和 第 6 块 被 做 了 标记 ， 因 为 它们 是 从 根 节 点 可 达 的 。 第 2 块 和 笋 SP 
标记 的 ， 因 为 它们 是 不 可 达 的 。 在 清除 阶段 之 后 ， 这 两 个 不 可 法 块 被 国 收 到 空闲 链表 。 


10.10.3 C ERFAHRT Mark&Sweep 

Mark&Sweep 对 C 程序 的 垃圾 收集 是 一 种 合适 的 方法 ， 因 为 它 可 以 就 地 工作 ， 而 不 需要 移动 他 
М, ЖШ, CEEA iPr 函数 的 实现 造成 了 — АОН, 

第 一 ，C ЖӘНЕН ЖЕКЕ, EE, 3 isPtr 没有 一 种 明显 的 方式 来 判断 它 
的 输入 参数 p 是 不 是 一 个 指针 。 第 二 ， 即 使 我 们 知道 p 是 一 个 指针 ， 对 isPtr 也 没有 明显 的 方式 来 判 
断 P 是 否 指向 -- 个 已 分 配 块 的 有 效 载 荷 中 的 某 个 位 置 。 

对 后 - -问题 的 解决 方法 是 将 已 分 妃 块 集合 维护 成 - 棵 平衡 二 义 树 ,这 棵 树 保持 着 这 样 : .个 属性 
左 子 树 中 的 所 有 块 都 放 在 较 小 的 地 址 处 ， 而 布 子 树 中 的 所 有 块 都 放 在 较 大 的 地 址 处 。 如 图 10.55 所 
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ле О Ар АОБА Е ТУИН О (Пей 和 Tight)。 每 个 了 段 指 问 茶 个 已 分 配 甘 的 
头 部 。 


baat Au He 11. BE 


Remainder of block 





图 10.55 ”一 棵 已 分 配 块 的 平衡 树 中 的 左右 指针 

isPtr(ptr D) 谓 数 用 竺 来 执行 对 已 分 配 块 的 一 分 查找。 在 每 一 步 中 , ЖЕТЕК ТІН АМЕН, 
CPUS p 是 省 沙 在 这 个 抉 的 范围 之 内 。 

从 茶 种 意义 上 来 次， 平衡 奎 方 法 是 正确 的 ， 例 如 它 保证 会 标记 所 有 从 根 首 点 可 达 的 他 点 。 这 是 
一 个 必要 的 保证 ， 内 为 应 用 程序 的 用 户 当 然 不 会 喜欢 把 它们 的 已 分 配 坎 过 品 地 返回 给 空闲 链 者 。 然 
Tp. H JA АЛЫ X. 二 而 吾 必 足 保 守 的 ， 因 为 它 可 能 不 正确 地 标记 实际 上 不 可 达 的 块 ， 开 因此 
ЖЕВНА СЕНА. 虽然 这 上 开 个 丸 响 应 用 程 字 的 正确 性 ， 但 是 这 而 能 导致 不 必 虹 的 外 部 伴 盯 。 

C 程序 的 Mark&Sweep 收集 器 必须 是 保 宁 的 ， 其 根本 原因 是 5 语言 不 会 用 类 型 信息 来 林 记 存储 
ELE. BE, BR int 或 者 float 这 桩 的 标量 可 以 伪装 成 指 守 。 例 如 ， 假 没 双 个 台 达 的 已 分 配 块 六 它 
的 生效 载荷 中 包含 一 个 int， 上 其 管 碰巧 对 应 于 某 个 其 他 已 分 配 块 b 的 有 效 载荷 中 的 -- 个 地 址 。 尘 收集 
SRI е, АНОМАЛИЯ НА TRU SC LS int 而 不 是 指针 。 因 此 ， 分 配器 必须 你 守 好 将 块 b 标 
记 为 可 达 ， 仿 管 绅 兴 上 它 可 能 是 不 是 可 达 的 ， 


1011 C 程序 中 常见 的 与 存储 器 有 关 的 错误 


村 程 序 员 光 说 ， 管 理 和 征用 复 拟 存储 器 可 能 是 仿 困 难 的 、 穿 易 出 错 的 任务 。 与 存 情 器 右 关 的 
tB IR T biba АЖЕ ЫЫ, ЖЕП ЕЕ ЕНІН ЖЕРІН E. TERRE EE XR PRESS, A 
ЯЛЫ Ж. ЖИНАҒАНЫ Ы АННАН, ЖӘНЕН KR ape f] Y LT MH. H 
ЙКЕЛ T ESSERE ER W АН CLER e P. RAER ИШ НЕН X RUE E ЖАН 
SR BE op RETO, £e ЖЕН) ЫН» 


10.11.1 间接 引用 坏 指 针 

下 如 我 们 在 10.7.2 入 中 学 到 的 ， 在 进程 的 虚拟 地 址 空间 中 有 较 大 的 洞 ， 没 有 映射 到 任何 有 意义 的 
数据 ， 站 果 我 们 试图 问 接 引 用 一 个 指向 这 些 洞 的 指针 ， 示 么 操作 系统 就 会 以 段 异常 终 目 我 们 的 程序 。 
和 而 中 ， 虚 拟 存 储 器 的 某 些 区 域 是 只 读 的 。 试 图 急 这 些 区 域 将 造成 以 保护 漳 常 终止 这 个 程序 。 

回 接 引 用 愉 指 针 的 “个 常见 去 鲍 是 经 典 的 scanf ЯНА. BREIZH sanf 从 stdin 该 一 个 
整数 到 一 个 变量 。 做 这 件 事 情 止 确 的 方法 是 传递 给 scanf - -个 格式 串 和 变量 的 地 址 '; 

scanfí'$d", &valj 

Жіп, ST СЛ ЛЕ Ше WAS И ЕШШ!), ЖА ФЕВ val 的 内 容 ， 而 不 是 它 
КРЕНЕ. 


scanfí'*d", val) 
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ТЕЗА Я, К, ясап 将 把 val 的 内 容 解释 为 一 个 地 址 ， 并 试图 将 一 个 字 写 到 这 个 位 置 。 在 最 好 
的 情况 下 ， 程 序 立即 以 异常 终止 。 在 最 糟糕 的 情况 下 ，val 的 内 容 对 应 于 虚拟 存储 器 的 某 个 合法 的 读 
/号 区 域 ， 于 是 我 们 就 覆 将 了 存 情 器 ， 这 通常 会 在 相当 以 后 造成 灾难 性 的 、 令 人 困惑 的 后 宁 。 


10412 ” 读 未 初始 化 的 存储 器 
HR.bss 存储 器 位 置 ( 诸 如 未 初始 化 的 全 局 СШ) 总 是 被 加 载 器 初始 化 为 零 ， 但 是 对 于 堆 存 
情 器 却 并 不 是 这 样 的 ， 一 个 常见 的 错误 就 是 假设 堆 存 储 器 被 初始 化 为 零 ; 
/* return y = Ax */ 
int *паұуес (ілі **À, int *x, int п) 


( 


int 1, `; 
int *y = (int *}Ма11ос{п * sizeofíiint)): 
tor {1 = 00; i < mn; i++} 

for (j = 0: j < n; j++) 


yli] += A[illjl * x[j]; 
return y; 


在 运 个 示例 中 ， 程 序 员 不 正确 地 假设 向 量 у 被 初始 化 为 零 。 正 确 的 实现 方式 是 在 第 8 行 和 第 9 
218 УІНЕ АЖ, ЖЕН calloe。 


10.113 Jt VERSER W d 

正如 我 们 在 3.13 节 中 己 经 看 到 的 ， 如 果 一 个 程序 不 检查 输入 种 的 大 小 就 号 入 栈 中 的 日 标 缓冲 
К, ЖАХМ ОВИХ ЯНЕ (buffer overflow bug)。 例 如 ， 下 面 的 函数 就 有 缓冲 区 错 
误 ， 因 为 gets 函数 拷贝 一 个 任意 长 度 的 串 到 缓冲 区 。 为 了 纠正 这 个 错误 ， 我 们 必须 使 用 fgets 函数 ， 
这 个 图 数 限制 了 输入 串 的 大小: 


1 


~] & л на іы RI 


void bufoverflowi) 


{ 


} 


char buf[64:; 


gets (buf); Æ here is the stack buffer overflow bug */ 
return; 


10.11.4 假设 指针 和 它们 指向 的 对 象 是 相同 大 小 的 
一 种 常见 的 错误 是 假设 指向 对 象 的 指针 和 它们 所 指向 的 对 象 是 相同 大 小 的 ， 


1 РСтгезіс an nxm array */ 

2 int **makeArrayl(int n, int m) 

3 { 

4 int 1 

5 int **A = [int **)Malloc (n * sizeofl(int!); 
5 

7 for {i = Ü; i < n: i++) 
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B A[1] = lint *#iMallocim * sizeof(int)); 
9 return А; 
10 } 


这 里 的 有 的 是 创建 一 个 由 n 个 指针 组 成 的 数组 ， 每 个 指针 都 指 同一 个 在 会 点 个 int ЖШ. Ж 
而 ， 因 为 程序 员 在 第 5 行将 sizeofünt *) 写 成 了 sizeoflint}y， 代 码 实际 创建 的 是 一 个 in 的 数组 。 这 上段 
代码 只 有 在 int 和 指向 int 的 指针 大 小 相同 的 机 器 上 运行 和 良好。 

但 十 ， 旭 未 我 们 在 像 Alpha 这 样 的 机 器 上 运行 这 段 代 码 ， 其 中 指针 大 于 int， 那 么 第 了 (TRUE 8 
和 有 的 逢 环 将 写 到 起 出 和 数组 未 问 的 地 方 。 因 为 这 些 字 中 的 一 个 很 可 能 荐 已 分 配 顽 的 边界 标记 贿 部 ， 
所 以 我 们 可 能 不 会 敌 现 这 个 销 误 ， 启 到 我 们 在 这 个 程序 的 后 面 很 久 释 放 这 个 顽 时 ， 此 时 ， 分 配器 中 
的 合并 代码 会 戏剧 性 地 失败 ， 而 没有 任何 明显 的 原因 。 这 是 “在 这 处 起 作用 《action at distance)" ËJ 
-个 阴险 水 例 ， 这 类 “在 远 处 起 作用 ” 旦 与 存储 器 有 关 的 网 程 错误 芍 典 型 情况 。 


10.11.5 造成 错位 错误 
错位 LOff-by-one) ЕЖЕН “- 圳 很 常见 的 桥 盖 错误 发 生 的 原因 ; 


1 /* Create an nxm array */ 


2 int **makeArrayZ;int n, int т} 

E { 

< int l; 

5 int **A = [int **)Mallocin * sizeoflíint]); 
6 

7 fòr {i = Ü; 1 <= n; 1++} 

8 А[11 = (int *)Mallocím * sizeofiint)]; 
9 return А; 


10 } 


这 是 前 面 一 他 中 程序 的 另 一 个 版 本 。 这 电 我 们 在 第 5 行 创建 了 个 个 元 素 的 指针 数组 ， 但 是 
随后 在 第 7 行 和 第 8 行 试图 初始 化 这 个 数组 的 ned 个 元 素 , 在 这 个 过 程 中 覆盖 了 A 数组 后 面 的 其 个 


10.11.6 引用 指针 ， 而 不 是 它 所 指向 的 对 象 
如 抄 我 们 不 太 注 意 妇 操作 符 的 优先 级 和 结合 性 ， 我 们 就 会 错误 地 操作 指针 ， 而 不 是 期 望 巢 作 指 
针 所 指 网 的 对 象 。 比 如 ， 考 虑 下 面 的 函数 ， 其 目的 是 删除 一 个 有 *size 项 的 一 叉 堆 里 的 第 一 项 ， 然 后 
对 剩 下 的 ssize-] 项 重新 建 堆 。 
int *binheapDelete(int **binheap, int *size) 
[ 
int *packet - binheap[0]; 


*size--;: /f*this should be (*size)-- */ 
heapify(binheap, *size, 01; 


2 
E 
4 
5 binheap[O0] = binheap[*size - 1]; 
b 
5 
8 returní(packet]; 

9 


] 
ЖЖ 3 行 ， 日 的 是 减少 size 指针 指向 的 整数 的 值 (也 就 是 说 是 (+size)- 2. ЯП, PUT Jn 
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Bi* x TT IL Gs Hi, АЕА 5, MA БРАКЕ ЧЕРНА ЈЕ А СИН, Tx 
ЖН ИВ, ade Ж АНЕ. Feras ИК, А n Be ДЕНЕ. "EFFE 
ЗАТЕ НОН ТРЕЕ КАЧЕНА, BS ЖННД ИЕ Г. E R WL E n ИЕ 
ХЕЛЕН E, ЖЛЕНІЗЕ Зе. ШШ. 636647, 我 们 可 以 清晰 地 表示 我 们 的 日 的 ， 使 用 
表达 式 (*+size)--，。 


10.11.7 “误解 指针 运算 
另 - -种 常见 的 错误 是 忘记 了 指针 的 算术 操作 是 以 它们 指向 的 对 铺 的 大 小 为 单位 来 进行 的 ， 而 这 


种 太 小 单位 并 不 一 定 是 守节 。 例 如 ， 下 向 函数 的 日 的 是 扫描 一 个 it 的 数组 ， 并 返回 一 个 指针 ， 指 
向 val 的 首 坎 出 更 ; 


1 int *searchíint Яр, int val) 

2 { 

3 while (Яр ЕЕ Яр іш val! 

4 p += sizeof[int); /*should be p+ */ 
5 return р; 

6 } 


ЖАП, КЛ ААН, ЖАЛТАН МЕНІ 4 СА r K), HERCULES TA IAE 
Ж +64 ЖҚ. 


10.11.8 引用 不 存在 的 变量 
没有 太 多 经 验 的 CC 程序 员 不 理 艇 栈 的 规则 ， 有 时 会 看 用 不 再 合法 的 本 地 变量 ， 如 小 列 所 示 ， 
1 int *staekreF f) 


[ 


int val; 


return &val; 
} 

这 个 函数 返回 - -个 指针 《比如 说 是 pp)， 指 向 栈 里 的 一 个 局 部 变量 ， 然 后 弹出 它 的 栈 帧 。 尽 管 p 
和 仿 然 指 回 -个 合法 的 存储 器 地 址 ， 但 是 它 己 经 不 再 指向 一 个 合法 的 变量 了 。 当 以 后 在 程序 中 调用 其 
他 消 数 时 ， 存 储 器 将 重用 它们 的 栈 巾 。 后 来 ， 如 时 程序 分 柄 菜 个 值 给 *p， 妙 么 它 可 能 实际 村 在 履 改 
为 一 个 靖 数 的 栈 巾 中 的 一 个 条 上 日 ， 从 而 带 来 潜在 地 灾难 性 的 、 令 人 困惑 的 后 时 。 
10.11.9 引用 空闲 堆 块 中 的 数据 


一 个 相似 的 错误 是 引用 已 经 被 释放 了 的 堆 妃 中 的 数据 。 例 如 ， 考 虑 下 面 的 示例 ， 这 个 示例 在 第 
6 行 分 本 了 一 个 整数 数组 x， 在 第 12 行 先 释 放 了 块 x， 然 后 在 第 14 行 又 引用 了 它 。 


2 
3 
4 
5 
6 


1 int *heapref;int n, int m] 

2 { 

3 int 1; 

à int %х, *y; 

5 

6 x = lint *]FMallocin * sizeofiint)); 
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7 
B /* ... */  Polther calls to malloc and free go here */ 

9 

10 Ereeix): 

11 

12 y = (int *}Ма11ос{ш * sizeofiint!); 

13 for {1 = D; 1 < m; i++! 

14 yli] = x[i]++;  # oops! x[i] is a word in a free block */ 
i5 

16 return y; 

17 } 


取决 于 在 第 6 行 和 第 10 RER malloc 和 free 的 调用 模式 ， 当 程序 在 第 14 行 引 用 xfij 时 ， 数 
纪 x 可 能 是 某 个 其他 已 分 配 堆 块 的 一 部 分 了 ， 因 此 其 内 容 被 重 写 了 。 种 其 他 许 甸 与 存 赃 器 有 关 的 错 
误 : " 样 ， 这 个 错误 只 会 在 程序 执行 的 后 备 ， 当 我 们 注意 到 y 中 的 值 被 破坏 了 时 ， 才 会 最 现 出 来 。 


10.11.10 引起 存储 器 泄漏 
ЕНЕ ЕНЕ. ЕНДР, SERAT ЖИЫНЫ, ТЕН ТЫ, 
ЖЕКИ ДШ. МШ. ТШШ ЛИТ 个 堆 块 n+， 然后 不 释放 它 就 返 四 。 


] void Jleakllnt n) 

А { 

3 int *x = [ink *]Mallocín * sizeoflint)); 
4 

5 return; Æ xis garbage at this point */ 

6 } 


WI leak 经 常 被 调用 ， ЖАНЫ, HRSG ЛЫЙ ТЫЯ, ERREUR. тт s os li 
地 卉 宇 间 。 对 于 像 守 扩 进 程 和 服务 器 这 样 的 程序 米 说 ， 存 储 器 泄漏 是 符 市 闫 重 的 ， 根 据 定 义 这 些 程 
序 是 不 会 终止 的 。 


10.12 ”扼要 重 述 一 些 有 关 虚 拟 存 储 器 的 关键 概念 


在 这 一 章 里 ， 我 们 已 经 看 到 了 虚拟 存储 只是 如 何 工作 的 ， 系 统 如 何 用 它 来 实现 某 些 功能 ， 例 如 
加 载 程序 、 映 射 共享 库 以 及 为 进程 提供 私有 受 保 护 的 地 址 空 扎 。 我 们 还 看 到 了 许多 应 用 程序 正确 或 
尾 不 正确 地 使 用 虚拟 存储 器 的 方式 。 

-个 关键 的 经 验 教 训 是 , 即使 虚拟 存储 器 是 由 系统 和 白 动 提供 的 , ЕЕЕ “种 有 限 的 存储 器 资源 ， 
应 用 程序 必须 精明 地 管理 它 。 赴 如 我 们 从 对 动态 存储 分 配器 的 研究 中 学 到 的 那样 ， 管 理 虚 拟 存 储 器 
资源 可 能 包 扫 一 些微 隶 的 时 间 和 空间 的 平衡 。 另 一 个 关键 的 经 验 教 训 是 ， 在 公称 序 中 很 容易 犯 与 存 
鱼 表 有 赤 的 铬 误 。 坏 的 指针 值 、 释 放 已 经 空 内 了 的 块 、 不 恰当 的 强制 类 型 转换 和 指针 运算 ， 以 及 覆 
TEAM, ӘН жә е ЕЛЖАН ЫТ ЗАРЫ ЗА, НЕЕ ХОН 
КЕСІК, ХЖӘ Java 产生 的 一 个 重要 原因 ，Java JG T RUE SOBRE BED, TERR [ БИГ 
作 配 器 ， 从 而 严格 控制 了 对 虚拟 存储 器 的 访问 。 
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10.13 小 结 


虚拟 存储 器 是 对 主人 存 的 一 个 抽象 。 支 持 虚 拟 存 储 器 的 处 理 器 通过 使 用 — RICE 3019 ht ht 18] 8 
形式 来 引用 主 存 。 处 理 器 产生 一 个 虚拟 地 址 ， 在 被 发 送 到 主 存 之 前 ， 这 个 地 址 被 翻 伴 成 一 个 物理 地 
址 。 从 虚拟 地 址 空间 到 物 捍 地 址 空间 的 邮 址 釉 译 要 求 硬件 和 软件 紧密 合作 。 专 门 的 硬件 通过 使 用 页 
表 来 翻 详 虚拟 地 址 ， 而 页 表 的 内 容 是 由 操作 系统 提供 的 。 

虚拟 存储 器 提供 三 个 重要 的 内 能 。 第 一 ， 它 在 主 存 中 自动 缓 往 最 近 使 用 的 存放 磁盘 上 的 虚拟 地 
进军 间 的 内 容 。 虞 拟 存储 器 缓存 中 的 块 叫做 页 。 对 磁盘 上 员 的 引用 会 触发 缺 页 ， 缺 页 将 控制 转移 到 
拘 作 系统 中 的 一 个 侧 页 处 理 程 序 。 缺 页 处 理 程序 将 页 面 从 磁盘 拷贝 到 主 存 缓存 ， 如 果 几 要 ， 将 写 同 
ЕЖЕЛ. ЖЛ, ШЫГА ЫН, Т {РЇ E ER. ИПХЫН ГЕК. ЖЕШКЕ. ИЕ 
的 存储 器 分 配 ， 以 及 程序 加 载 。 最 后 ， 虚 拟 存储 器 通过 在 每 条 页 表 条 日 中 加 入 保护 位 ， 从 而 了 简化 
ГЕНА. 

ИИ ИЕБИ АНЕ AR Ir HR TE SEO fr E. Х®йй®%ЖНЇ ҮЕ Li юй 
缓存 中 ,但 是 一 个 称 为 TLB ЛЖАН LIBERARE, ЖИ НИТТЕ LI ГЕЯ AE H 
的 开销 。 

现代 系统 通过 将 虚拟 存储 器 组 块 (chunk) 和 磁盘 上 的 文件 组 块头 联 起 来 ,来 初始 化 虚拟 存储 器 
组 块 ， 这 个 过 程 称 为 存储 器 映射 。 存 情 器 鼎 射 为 共享 数据 、 创 建新 的 进程 以 及 加 载 程序 ， 提 供 Г 
种 硕 效 的 机 制 。 应 用 可 以 使 用 mmap 泌 数 来 手工 地 创建 和 删除 点 拟 地 址 空间 的 区 域 。 然 而 ， 大 多 数 
程序 依 束 于 动态 存 情 器 分 配器 ， 例 如 imalloc， 它 管理 虚拟 地址 空间 区 域内 一 个 称 为 堆 的 区 域 。 动 态 
ИЕЛЕ ТН АЙЯ АНЫН ЖР, 它 直接 操作 存储 器 , 而 无 需 类 型 系统 的 很 多 帮助 。 
分 配器 有 六 种 类 型 ; 显 式 分 配器 要 求 应 用 显 式 地 室 放 它们 的 存储 器 块 : 隐 式 分 配器 【〈 垃 级 收集 器 ) 
日 动 释放 任何 无 用 的 和 不 可 达 的 块 ， 

AY С 程序 员 来 说 ， 管 理 和 使 有 虚拟 存储 器 是 一 件 困难 和 容易 出 错 的 任务 ,常见 的 错误 示例 包 
Tñ: 间接 引用 坏 指针 ， 访 取 未 初始 化 的 存储 器 ， 允 许 栈 缓 冲 区 溢出 ， 假 设 指针 和 它们 指向 的 对 象 大 
小 相同， 引用 指针 而 不 是 它 所 指向 的 对 象 ， 误 解 指 针 运 算 ， 引 用 不 存在 的 变量 ， 以 及 引起 存储 器 沪 
BR. 


参考 文献 说 明 

Kilburn 和 他 的 问 事 们 发 表 了 关于 虚拟 存储 器 的 第 一 篇 玲 述 [42]。 ЖАЯМЫЗ ТРАЕ 
企 虚 所 存储 器 中 的 角色 的 额外 细节 [33]。 操作 系统 教科 书包 含 关 于 操作 系统 角色 的 额外 信息 [70, 83， 
75]. 

Knuth 在 1968 FHS f ОРА o EE EZ EA. АЛАН, ХШ Н ТОЖУ 
М. Wilson, Johnstone, Neely 和 Boles 编写 了 关于 显 式 分 配器 的 完美 调查 和 性 能 评价 的 文章 [88]， 
本 书 中 关于 各 种 分 配器 策略 的 弄 吐 率 和 利用 率 的 - 般 评 价 就 引 自 于 他 们 的 调查 。Jones 和 Lins 提供 
ТХЕТМАН МӘНІСІ |371. Кеппірһап 和 Ritchie[40] 展 示 了 -个 简单 分 配器 的 完整 代码 ， 这 
个 午 单 的 分 配器 是 基于 显 式 空闲 链表 的 ， 每 个 空闲 蕊 中 部 有 一 个 块 大 小 和 后 多 指针 。 这 段 代 码 使 用 
联合 (union ) 来 消除 大 量 的 复杂 指针 运算 ， 这 是 很 有 趣 的 ， 但 是 代价 是 释放 操作 是 线性 时 间 【 而 不 
是 常数 时 间 )。 
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www.cs.colorado.edu/-zorn/DS A.html 上 Zorn 的 Dynamic Storage АПосапоп Repository 【动态 存 
ETETE) 是 -个 很 方便 的 资源 。 它 包括 检测 与 存 情 器 相关 的 错误 的 调试 工具 ， 以 及 malloc/free 
和 和 垃圾 收集 器 的 实现 ， 


家 庭 作业 

10.11 € 

在 下 徊 的 一 系 剂 问题 中 ,你 要 展示 10.6.4 节 中 的 示例 存储 器 系统 如 何 将 虚拟 地 址 釉 详 成 物理 地 
址 ， 以 及 训 何 访问 缓存 。 对 于 给 定 的 虚拟 地 址 ， 请 指出 访问 的 TLB £H. ЕНШІ, DL URBI 
存 字 节 值 , 请 指明 是否 TLB Ait, ERRETEN., 是否 发 千 了 缓存 不 命中 。 如 此 有 缓存 不 命中 ， 
对 十 “返回 的 缓存 学 节 ” 用 “-” 来 表 水 。 如 果 有 缺 页 ， 对 十 “PPN” 用 “-"” 来 表示 ， 并 把 部 分 C 
H DATH. 
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10.12 % 

XP T FEBR. ЖИНА 10.11: 
BOMBE: 0x0339 

A. ВАН 


тэке ОГ 
лыве | 
www | 
жр 


C. 物理 地 址 格式 








10.13 € 
对 于 下 向 岗地 址 ， 重 复习 是 10.41: 
ШЕМ: 0x0040 
А. ШААН zx 
з 12 H ш 9 8 7 6 5 4 3 2 р 0 
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m — — 


C， 物理 地 址 烙 式 








缓存 标记 
ЖАН? CYN) 


ЖЫН Е H 


10.14 %% 


fé 8 — W XE hello.txt, ЗЕ "Hello, worldn" 组 成 。 编写 — C WEF, 使 用 mmap 
来 改变 hello.txt 的 内 容 为 “Jello, world n". 


10.15 % 
确定 下 面 的 maloe iR ЖЕУ EL B МНЕ 假设 ; 分 配器 维持 双 字 对 齐 , 使 用 图 10.37 
FER XU E ЕЕ; 块 大 小 向 上 舍 入 为 最 接近 的 $8 字 节 的 倍数 。 


RAJ HEMP | жан Сы) 










10.16 € 
ЕРКЕ ЛЕ AS aW k Ki. БӘ. ЗИНЕШ. STE E 


US) pred 和 succ 指针 、 不 多 许 有 效 载 闪 的 大 小 为 零 ， 并 几 头 部 和 脚 部 存放 在 - USE Y SE 
里 。 
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头 部 和 脚 部 


LE НЕМИ 





10.17 %%% 

JF 109.12 Tir ТАС PS, Hr Р ЕКО, ІН ЖЕН ІЛЕГЕ Ж. 

10,18 %%% 

10.9.12 ТЕУ as S sk R£ WR BER АИВ ЕНЕ, ШЗЕШ ЖЕ ІН Ее». ЖШ. E 
егің Ен ЕЗІНІҢ, "un 5А B E LI 


10.19 € 
РАНТА ЕАН НИВ, (ESRB. А-А ЕЕ. ЇЇ 
ВЕЕ КЕ АЈДЕ -E ER ВЧ. 
]. (а) —{ХЁ Жї т. ЈА 5092 [BJ] РА НИП Ж ИЙ Т. 
(b) АИА yB S АА Ea BOSE I0. Орт) 
(с) АТ = ШЕ ГЕККЕ ТҮ iñ sh Hh HS НЕ ЕРЕН, НІЛ ЛІ ЖЫГА ИЖ. 
(D 伙伴 系统 只 会 有 内 部 碎片 ， 而 不 会 有 外 部 碎片 。 
2. Са) 在 护照 块 大 小 岂 握 的 顺序 排序 的 空闲 链表 上 ,使 用 首次 适 配 算法 会 导致 分 配 性 能 很 低 ， 
但 是 可 以 避免 外 部 碎片 。 
(b) 对 于 最 佳 适 本 方法 ， 宅 闲 块 链表 应 该 护照 存 情 器 地 址 的 递增 排序 。 
(с) 最 侍 适 配方 法 选择 请 求 段 匹配 的 最 大 的 空闲 块 。 
(d) ЕКИ ОМ НИН ЗЕ Е, ДЕНІҢ РГЕН ТІ S ERR [OE RES 
ft- 
3. Mark&Sweep HIRIE 28d КЛ Ын, КИЧ RSF f: 
(a) 它们 只 有 在 存储 器 请 求 不 能 被 满足 时 才 合 并 被 释放 的 存 情 器 ， 
(b) 它们 把 - 切 看 起 来 像 指针 的 东西 部 当 作 指针 。 
(с) 它们 只 在 用 尽 存 储 器 时 ， 才 协 行 垃圾 收集 ， 
(D ПЕ КЕДЕННЕН ТЕ. 
1020 %%%% 
编 与 你 目 己 的 malloc 和 free АЖ, 7 ЗЕТ ЇН] ІРІНДІ ЕС 库 提供 的 malloc 版 
本 进行 比较 。 
练习 题 答案 
练习 题 10.1 答案 
这 道 题 让 你 而 不同 地 批 空 间 的 大 小 有 了 些 了 解 。 曾 几何 页 , 一 个 32 位 地 未 空间 看 上 去 似乎 是 不 
可 能 的 大 。 但 是 ,现在 有 些 数据 库 和 科学 应 用 希 要 更 大 的 地 址 空间 ， 而 用 你 会 发 现 这 和 神 趋 势 会 继续 。 
在 你 的 有 生 之 年 ， 和 你 可 能 会 抱怨 你 的 个 人 电脑 上 那 狭 促 的 ба 位 地 址 空间 1 


662 %10% 


# ИН їл) # 惟 一 的 地 址 (М) 最 大 地 址 


і 
216-04 2!%-1 = 64K-] 
y = 16384Р 364 16384Р-1 


练习 题 10,2 ЖЕ 
因为 每 个 虚拟 页 面 是 P= 22 字 节 ， 所 以 在 系统 中 总 从 有 272^ = 2"? 了 个 可 能 页 面 ， 其 中 每 个 都 和 
要 -个 页 表 条 H (PTE). 








练习 题 10.3 答案 

为 了 完全 掌握 地 二 翻译 , 你 需要 很 好 地 理解 这 类 问题 。 下 面 是 不 何 解决 第 一 个 子 洁 题 :我 们 有 n=32 
个 虚拟 地 址 位 和 m=24 个 物理 地 址 丛 。 页 面 大 小 是 此 1IKB， 这 意味 者 对 于 VPO 和 РРО, Ж{П = 
1орз(1К)=10 fii, ЧИ — F, VPO 和 PPO 是 相同 的 , 剩 下 的 塌 址 位 分 别 是 VPN 和 PPN. 








| [жюн [ини [жюз 

ө» wl 

Lm a pa 
4КВ 12 12 12 
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练习 题 10.4 ЖЖ 
做 一 齿 这 梓 的 手工 模拟 ,能 很 好 地 丽 思 你 对 此 址 翻译 的 理解 。 你 会 发 更 号 出 地 址 电 的 所 有 的 位 ， 
然后 在 不 同 的 他 字段 上 画 出 方 霸 ， 例 如 VPN. TLBI 等 等 ， 这 会 很 有 帮助 ， 在 这 个 特殊 的 练习 中 ， 
没有 任何 类 型 的 不 命中 : TLB 有 一 份 PTE КИЯЛ, TATA - 份 所 请 求 数据 字 的 挡 凡 。 对 于 命中 和 
А ЧЭ Ну : 些 术 同 的 组 合 ， 请 参见 习题 10.11. 10.12 和 10.13. 

А. 00 0011 1101 0:11 













B, VEN: Ох? 
TLBI: Jx 
TLET: 0х3 
тв 命中? Y 
ЖА? М 
PPN: xd 


C. 0611 0101 0111 


1 tinclude "сѕарр.һ" 
2 
3 /* 
4 * mmapcopy - uses mmap Lo copy file fd tè stdout 
5 
Б vold mmapcopy (int fd, int size) 
7 
3 char *bufp; /* ptr to memory mapped VM area */ 
9 
10 bufp = Mmapí(NULL, size, PROT READ, MAP PRIVATE, fd, 0); 
11 Writeil, bufp, size): 
12 return; 
13 } 
14 
15  /* mmapcopy driver */ 
15 int main(int arge, char **argv| 
17 f 
18 struct sta- stat; 
13 int fd; 
20 
21 /* check for required command line argument */ 
22 if (атас (= 2) 1 
23 printfí'usage: $s <711епайе>\п", argví0]); 
24 exit {ü}; 
25 } 
26 
27 /* copy the input argument to stóout */ 
28 fd = Openíargv[1], O RDONLY, 0); 
29 Estat (Zd, &stat); 
30 пмарсорү (Ёа, stat.st size): 
3l exit (0); 
32 ] 
练习 题 10.6 答案 


XB Г БН, FID S k. Ooh Kh K АЕ. MERA pii 
方法 是 , ННІ 28 3k 13 bg КАЛЕ А Е (bh E s z REMER., 
比如 ，malloect1) 请 求 的 块 大 小 是 4+1=5， 然 后 舍 入 到 8。 而 malloc(13) 请 求 的 块 大 小 是 13+4=17， 会 


A TLS TS 


D. CO: 0x3 
Cl: 0х5 
CT: Оха 
mA ero Y 
DRAFT? 0х1д 
练习 题 10.5 答案 


解决 这 个 题目 将 帮助 你 很 好 地 理解 在 储 器 上 映射。 请 自己 独立 完成 这 道 晤 。 我 们 没有 讨论 open, 
fstat 或 者 write 务 数 ， 所 以 你 需要 阅读 它们 的 帮助 咏 来 看 看 它们 是 如 何 工 作 的 。 
— сойе/утйптарсору.с 


code/vmr/mmapcopv.c 
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和 到 24. 


块 大 小 {十进制 字 节 ) | RAM ARD 


ew БЕНЕН БЕН ШЕНГЕН 
эшен | — СОНИ 


练习 题 10.7 答案 

最 小 欣 太 小 对 内 部 碎 月 有 显著 的 影响 ， 因 此 ， 理 解 和 不 同 分 配器 谈 计 和 对 齐 要求 相 关联 的 最 小 
块 人 小 是 很 好 的 。 很 有 技巧 的 -部 分 基 ， 要 意识 天 相同 的 块 可 以 在 不 同时 刻 被 分 本 或 者 被 释放 。 因 
此 ， 匡 小 拱 大 小 就 是 最 小 已 分 配 卖 大 小 和 最 小 空闲 均 大 小 两 者 的 最 大 值 。 例 如 ， 在 节 后 一 个 子 问题 
中 ， 最 小 的 己 分 配 换 类 小 是 一 个 4 字 节 头 部 和 一 个 上 字 节 有 效 载 荷 ， 作 入 到 8 宝 和 节 。 而 最 小 空闲 块 
的 大 小 是 一 个 4 字 节 的 头 部 和 -个 4 字 节 的 脚 部 ， 加 起 来 是 & 字 节 ， 已 经 是 8 的 倍数 ， 就 不 索要 再 
合 入 了 。 所 以 ， 这 个 分 配器 的 最 小 块 大 小 就 是 8 字 节 。 








S 5188 10.8 答案 


这 电 设 行 特 知 的 技巧 。 但 是 解答 此 题 要 求 你 理解 我 们 简单 的 隐 式 链表 分 配器 的 剩余 部 分 是 如 何 
了 作 的 ， 是 如 何 操作 和 遍 上 块 的 。 


— cedeynvmailoc.c 
1 static void *find fití(size t asize) 
2 i 
3 void “рр; 
4 
5 /* Lirst fit search */ 
б for (Бр = heap listp: GET SIZE(HDRPibpl) > 0; bp = NEXT BLEPIibp)? í 
7 if (!GET ALLOC(HDRP(bpi] && (asize <= GET SIZEIHDRPibpll!i) 4 
8 return bp: 
9 | 
10 ) 
11 return NULL; /* no Eit */ 
12 ] 

code/vm/mallnc.c 
练习 题 10.9 ЖЖ 


AKE УТ АЗА y ñu shy АЛ ЕНЕ BUR K DÆ 16 Т. 如果 
ТЕПЕ FI K TR Рза AA, ЖАРЫП АЕ O6 10 470. 这 时 惟一 有 技巧 
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的 部 分 是 要 意识 到 在 移动 到 十 一 块 之 前 :第 8 行 )， 你 必须 放置 新 的 已 分 配 块 《第 6 行 和 第 7 行 )。 


OOo U vqeode/vnvmalloc.c 
H static void place(void “Бр, size t asize) 
á i 
3 size t csize = СЕТ SIZE(HDRPIbp)): 
4 
5 if (ісвіге - asize) >= (DSIZE + OVERHEAD)) 1 
Б РОТ HERE {bp}, ВАСЕ(ав12е, 1)); 
7 PUT(FTRPÍDp), PACKlasize, 1)): 
B bp = NEXT BLEP (bp); 
9 PUT(HDRPiíbp), РАСКІсвісе-авіге, 03); 
10 PUT(FTRP(Dp), PACK(csilze-asize, С)); 
11 j 
12 else í 
13i PUT(HDRPíbp), PACK(cSize, 1}); 
14 PUT(FTRP(bp), РАСКісвіге, 1}); 
15 } 
15 
code/vm/malloc.c 
练习 题 10.10 答案 


这 里 有 - -个 会 引起 外 部 碎片 的 模式 :应 用 对 第 一 个 大 小 类 做 大 量 的 分 配 和 释放 请 求 ， 然 后 对 第 
一 个 大 小 类 做 大 量 的 分 配 和 释放 请 求 ， 接 卜 来 是 对 第 二 个 大 小 类 做 大 量 的 分 配 丢 放 请 求 ， 以 此 类 
推 。 对 于 每 个 人 小 类 ， 分 配器 都 创建 了 许 包 不 会 被 回收 的 存储 器 ， 因 为 分 配器 不 会 合并 ， 也 内 为 应 
用 不 会 届 由 过 个 大 小 类 和 再次 请 求 块 了 。 


E 
^ 
en АДЫМЫ 


第 3 部 分 
程序 间 的 交互 和 通信 


输入 和 输出 。 然 而 ， 在 现实 世界 里 ， 应 用 程序 利用 操作 系统 提供 的 服务 来 与 
UO 设备 太 其 他 程序 通信 。 
本 书 内 这 一 部 分 将 使 你 了 解 Unix 操作 系统 提供 的 基本 ORE, 以 及 如 何 用 这 些 


FX 们 学 4 计算 机 系统 和 现在， 一直 假设 程序 是 独立 运行 的 ， 只 包含 最 小 限度 的 


服务 来 构造 应 用 程序 ， 例 如 Web 客户 铅 和 服务 器 ， 它 们 是 通过 Internet 彼此 通信 的 。 


你 将 学 习 编 写 诸如 Web 服务 器 这 样 的 可 以 间 时 为 多 个 客户 端 提供 服务 的 并 发 程序 。 
当 你 学 宛 了 这 个 部 分 ， 你 将 稳健 步 入 权威 程序 员 的 行列 ， 能 够 充分 理解 计算 机 系 
统 以 及 它们 对 你 程序 的 影响 。 
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系统 级 IO 


ll Unix l/O 

11.2 ”打开 和 关闭 文件 

11.3 БУ 

11.4 “用 Rio 包 进行 健壮 地 读 和 写 
115 ЕУ Иос Е 

11.6 ”共享 文件 

11.7 lO 重 定向 

11.8 标准 IO 

П9 fé: 我 该 使 用 哪些 ИО 函数 ? 
11.10 ДЕ 


6/0 
871 
6/3 
674 
679 
681 
584 
585 
586 
58/ 


670 $1 > 


输入 /输出 《11O) 是 在 主 存 (main memory) SAFE Cl bn efr UAR. ШИЙ) 218 
HUARERE. WAREM UO WEST ДІР, ПИШЕ ЕМ. + tri USED UO W 
备 。 

所 有 庄 言 的 运行 时 系统 都 提供 乓 行 VO dgise e DERI] ГА. BIG, ANS C 提供 标准 О 库 ， 包 
Tš E printf 和 scanf 这 样 执 行 带 组 溃 的 TO ER C. Cris н ШҮ. Е << OLD Жо> Og 
И Т ЗАНЫН. (E Unix 系统 中 ， 是 通过 使 用 由 内 核 提供 的 系统 级 Unix VO 函数 来 实现 这 些 校 
ШК ЖГ) ГО ERES. КЖК. AAA IO Р TEIS SE, WH БЕНЕН Unix НО. 那么 
为 什么 还 要 麻烦 地 学 习 Unix VO W? 

. 了 解 Unix UO 将 帮助 你 理解 其 他 的 系统 概念 , VO 是 系统 操作 不 可 或 而 的 一 部 分 ， 因 上 比 ， 我 
ПЕРЕН UO 和 其 他 系统 贩 售 之 间 的 循环 依赖 ， 例 如 ，LO 在 进程 的 创建 和 执行 中 扮演 着 
API DE, RIDE. ЕНУ ЕНЕ АУС Е ЕНА ЕЕ. DU. € 
真正 理解 FO， 你 必须 理解 进程 ， 色 之 亦 然 。 在 对 存储 器 (memory) 结构 、 结 构 链接 和 加 
载 、 进 称 以 及 虚拟 存储 器 的 讨论 中 ， 我 们 已 经 接触 了 „О 的 某 些 方面 。 既 然 你 对 这 些 概 念 
有 了 比较 好 的 理解 ， 我 们 就 能 闭 人 台 这 个 循环 ， 吏 如 深入 地 研究 ПО. 

* 有 时 你 除了 使 用 Unix VO 以 外 别 无 选择 ， 在 某 些 重要 的 情况 中 ， 便 用 两 级 VO RREA 
В. ЛАЗ. Яш, $e UO 库 没 行 提供 读 取 祥 什 元 数据 前 方式 ， 这 些 元 数据 包括 
文件 大 小 或 文件 创建 时 间 。 更 有 其 者 ，LO 库 还 存在 一 些 问题 ， 使 得 用 它 来 进行 网 络 编程 非 
ЖОН. 

这 ЖР Unix FO 和 标准 ГО И, ЯНЕ ЙЛ ASE rh C 程序 中 如 何 可 靠 地 使 

用 它们 。 除了 作为 一 般 怕 的 介绍 之 外 , 这 TEARRE ЈА 2) ЮМ ЛЛ ЖУЙЕШ E ТЕРІН А. 


11.1 Unix О 


-个 Unix 文件 语 是 一 个 m ЕТІН 
Bo, Bp Ba, В, 

所 有 的 FORE. HAR, МЗЖ. ЖЕК УЙ. TAARA ТА Е F 
ЖМ ЕН ЕЯГЫ RAH. ООН AERES A RAA fep Unix 内 核 引出 一 个 简单 、 
低级 的 应 用 楼 口 ， 称 为 Unix UO, Xx fe fa PB JS A MAE- 种 统一 且 一 至 的 方式 来 执行 : 

* dX. КУ БЕШ EGK S Ek ЛУ УЕ. еу ТОВ. 
内 核 返回 一 个 小 的 非 负 整数 ， 岂 做 描述 将 ， 筷 在 后 续 对 此 文件 的 所 有 拘 作 中 标识 这 个 文件 。 
акык МЕКЕ, ii FH REFS BL ЛОПЕ ЧАМ. 

Unix shell @] ffi МЕННЕН УТУЕ f: ЖАНА (ЖЯ OD. ЖЖ 
输出 【描述 人 符 为 17 和 标准 错误 (描述 符 为 2)。 ДУН > X, T E STDIN. ЕН ЕМО. 
STDOUT FILENO 和 STDERR_FILENO， 它 们 可 用 来 代替 显示 的 描述 符 值 。 

“ 改 谈 当前 的 文件 位 置 。 内 核 保 持 者 一 个 文件 位 置 上 对 于 每 个 打开 文件 ， 初 始 为 0D。 这 个 六 
件 位 冲 是 从 文件 开头 起 始 的 字 节 偏 移 量 。 庶 用 种 序 能 够 通过 执行 seek BRE. TABERE у 
Ж ЕГИН. Ж.А k. 

* EKIH. - ЕТЕ БА ЖЇН ЕЛ no ETATER, wg ЕШ ИЩ. ЖА 
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后 将 大 增加 到 大 +n。 给 定 一 个 大 小 罗 m h ЕЙ, 3 Km Bh ir it A ACT АО 
end-of-file (EOF) 的 条 忻 ， 应 用 程序 能 检测 到 这 个 条 忻 。 在 区 人 忻 结 尾 处 并 没有 明确 的 “EQOF 


ары”, 
Яу, EMeÜERLE IER ЕЛ ps0 个 字 节 到 一 个 文件 ， 从 当前 文件 位 置 上 开始 ， 然 
ЕЕЕ, 


e 关闭 文件 ， 当 应 用 完成 了 对 文件 的 访问 之 后 ， 它 就 通知 肉 核 关 闭 这 个 文件。 失 核 释放 文件 
打开 时 创建 的 数据 结构 ， 并 恢复 描述 符 到 可 获得 描述 符 池 中 ， 以 示 响 应 。 无 论 一 个 进程 因 
为 何 种 原因 终止 时 ， 内 核 都 会 关闭 所 有 打开 的 文件 并 有 释放 它们 的 存储 器 资源 。 


11.2 ”打开 和 关闭 文件 
进程 是 通过 调用 open 国 数 来 打开 一 个 已 存在 的 玄 件 盛 者 创建 一 个 新 文件 的 ; 


tinclude «sys/tvpez.h- 
*finclude «sys/stat.h» 
&include «fcentl.h- 


int open|char *-*ilename, int flags, mode t mode); 


ШЕ. 若 成 功 则 为 新 式 件 描述 罕 ， 老 出 错 为 -1，。 





open Ж filename 转换 为 一 个 文件 描述 符 ， 并且 返回 描述 符 数字 。 返 回 的 描述 符 总 是 在 进程 
中 当前 没有 打开 的 最 小 描述 符 。flags AGERA T SORT ALIE; ЕЖ. 

е O RDONLY: RÈ. 

* O WRONLY: RS, 

а О RDWR: ЕУ, 

例如 ， 下 面 的 代 但 谎 明 如 和 何以 读 的 方式 打开 一 个 已 存在 的 文件 ， 

fd = Opení("foo.txt", O RDONLY, 0}; 

flags 参数 也 可 以 是 一 个 或 者 更 多 位 掩 码 的 或 ， 为 写 提 供给 一 些 额外 的 指示 ; 

* О CREAT: 如 果 文 件 不 仓 在 ， 就 创建 它 的 一 个 截断 的 【tmncated ) (2) 文 性 ， 

e O TRUNC: 如 果 文 件 已 经 存在 ， 就 截断 它 。 

• О APPEND: 在 每 次 写 操作 前 ， 设 置 文件 位 置 到 文件 的 结尾 处 。 

例如 ， 下 向 的 代码 说 明 的 是 如 何 打开 - -个 已 存在 文件 ， 并 在 后 面 添加 一 些 数据 ， 

Ға = Open("foo.txt", О WRONLYiO APPEND, 0); 

mode 参 教 指定 了 新 文件 的 访问 权限 位 。 这 些 位 的 符号 名 字 如 图 11.1 所 示 。 

作为 上 下 文 的 一 部 分 ， 每 个 进程 部 有 一 个 umask， 它 是 通过 调用 umask йй Ж RA, ЖШ 
X SEAT mode 参数 的 open 曾 数 调用 来 创建 一 个 新 文件 时 ， 文 件 的 沪 问 权限 位 被 设置 为 mode & 
-umask. ЖШ, fx REA SE КІН mode 和 umask ЗАЯ. 


fdefine DEF, MODE S IÍRUSR|IS IWUSR|S IRGRP|S IWGRP|S IROTH|S ІМОТН 
*define DEF, UMASK 5 IWGRP|S IWOTH 
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使 用 者 【拥有 者 ) 能 够 该 这 个 立 忻 

使 用 者 ӨНЕ) ЕНЕР 
S IXUSR (ЕҢ ОАО ВЕНЕТА ЧЕ 
S [RGRP RAAR ERN АН up iX POL 55 


2 IWGRP 拥有 单据 在 组 的 战 员 能 够 号 这 个 六 性 

S IXGRP | АЖЕ ОТЕ ЕЕН ТЕ 
S, IROTH 其 他 成 员 《 侍 何 成 员 ; 能 够 该 这 个 文 站 
S_IWỌOTH AE ERED ТЕК ЕПА ЛУ 
5_ТХОТН 其 他 上 成员 【任何 成 员 ) ЕЯАНЫА T УЕ 


图 11.1 访问 权限 位 





人 sysfstath 中 让 X. 
ЕТЖ, РЕНИ ТРЕ ЛОС, РЕВА ТУВЕ, ТАТ НЬ АН ЈУ ВТ 
ИЙ: 


umask (DEF. UMASK); 
fd = Opení("fào.txt", D CREAT|O TRUNCIO WRONLY, DEF МОРЕ); 


最 后 ， 进 程 通过 调用 close 函数 关闭 ТИ CE. 


&include <unistd.h> 


int closeí(int Ға); 





退回: 车 成 功 则 为 四， 落 出 错 则 为 -1， 


AMI— T e XH A RES B. 


练习 六 11.1 

下 面 程 序 的 输出 是 什么 ? 

t *incluce "-2sapp.h" 

2 

3 int mainí) 

4 { 

5 int fdl, 142; 

5 

7 ІЗІ = Open("foo.txt', CO RDONLY, 0j; 
H Closeiífdl:!: 

9 Га; = Opení("baz.txt', C ВПО, 0); 
10 printfi"fd2 = %й\п". Ё42); 

11 exit (Q); 


là |】 
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11.3 ” 读 和 和 写 文 件 
访 朋 程序 是 通过 分 别 调用 read 和 write 函数 来 执行 输入 和 输出 的 ， 


#include «unistd.h- 


ssize t -read(int fd, void *buf, size t n); 


返回 : ЙТИ, 3 EOF 则 为 0， 若 出错 为 -1。 


s51ze t writeilnut fd, const void *buf, size t n); 


Ж: 郑成功 则 为 写 的 字 他 数 ， 若 出 销 则 为 -|， 


read PR M Ha xe fX td 的 当前 文件 位 置 拷贝 至 多 并 个 字 节 到 存储 器 位 置 buf. BEHE- 表示 一 
个 错误 ， 而 返回 值 和 表示 EOF。 否 则 ， 返 癌 值 表示 的 是 实际 传送 的 宇 节 数量 ， 

write 函数 从 存储 器 位 置 buf 1€ E38 € n APERE fd 的 当前 文件 位 置 。 图 11.2 展示 了 一 
个 程序 恒 用 read 和 write 调用 -次 一 个 字 节 地 从 标准 输入 拷贝 到 标准 输出 。 





code/to/cpstdin.c 


1 #include "сварр.һ" 

2 

3 int main(void) 

4 | 

5 char c; 

6 

7 while(Read(STDIN FILENO, &c, 1) !- 0; 
Я Write'STDOUT FILENO, вс, 1}; 

9 exlt {0}; 

10 } 


сойе/то/срвїп. c 
图 11.2 一 次 一 个 字 节 地 从 标准 输入 拷贝 到 标准 输出 


通过 调用 bek 函数 ， 应 用 程 字 能 够 显示 地 覆 改 当前 文件 的 位 置 ， 这 部 分 内 容 不 在 我 们 的 讲述 
范围 之 内 。 

583: ssize 1 和 size 1 SE TZ К? 

你 可 能 已 经 注意 到 了 ，read Ж Ж — A size; 1 的 输入 参数 和 一 个 ssize 1 ЗК ТЕМЕ, ЖА АЖ 
XE н ЖА АИЯ? зше UICE ЭХ unsigned int. 而 ssize CUR JE k F ) 被 定义 为 int, read 
EREM- AREFE, EXAM EHE, RANA kenam- 有 趣 的 是 ， 
i& wu) — 71 的 可 能 性 使 得 read КАЛЕ, А40ВЖ 4 7 2GB. 


在 某 些 情况 下 ，read 和 write БЕКНЕИН МНЕ ЖИЕ», ЕДД Ë hort count). Ж 
一 证 是 错误 。 因 为 一 些 原因 ， 会 出 现 这 样 的 情况 ; 

° ҖИ EOF. 假设 我 们 准备 读 一 -个 文件 , 该 立 件 从 当前 文件 伺 置 开 始 只 含有 20 多 个 字 节 ， 

而 我 们 以 50 个 字 节 的 组 抉 (chunk) 进行 读 取 。 这 样 -来 ，F- -个 read 返回 的 不 足 值 为 20, 
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此 后 的 read 838 EDS B] 0 H EOF 信号。 
e 从 终 痛 读 文 本 行 。 如 果 打 并 文件 是 与 终端 相关 联 的 【 例 站 ， ЖЕЛЕ Ses), ЖАТ read 
毅 数 将 一 次 传送 -个 文本 行 ， 返 加 的 不 是 值 等 于 文本 行 的 大 小 。 
. А ЖЕТ 【socket )。 如 昌 打 开 的 文件 对 应 于 网 络 套 接 字 【12.33 节 )， 那 么 内 部 组 
冲 约束 和 较 长 的 潮 络 延迟 会 引起 read 和 write 返回 不 足 信 。 对 Unix 管道 (pipe) 调用 read 
和 write， 了 世 有 可 能 出 现 不 足 值 ， 这 种 进程 闻 通 信和 机 制 不 在 我 们 讨论 的 范围 之 内 。 
ЖЕ, ER fO EOF, ЧОЛУ ЕЧ, МАЈА АЕ, ШПНЕ ЕВ, b av 
避 到 不 是 值 。 然 而 ， 如 果 你 配 创 建 健壮 的 【 串 靠 的 ) 诸如 Web 服务 器 这 样 的 网 络 应 用 ， 就 必须 处 理 
Hd REI read 和 write 引起 的 不 趾 值 ， 直 到 所 有 需要 的 字 节 都 传送 完毕 。 


11.4 用 Rio 包 进 行 健 壮 地 读 和 写 


本 这 一 小 节 里 ， 我 们 会 讲述 一 个 UO 包 ， 称 为 Rio (Robust ПО, ЕН TO) 8, ZAJA 
你 处 理 二 区 中 所 述 的 不 起 值 。 在 像 网 络 程序 这 样 容 易 出 现 不 号 值 的 应 用 中 ，Rio 包 提 供 了 方便 、 健 
ARRI ШО. Rio 提供 “两 类 不 同 的 着 数 ， 
. 无 缓 冲 的 输入 输出 函数 。 这 些 缠 数 贞 接 在 存储 器 和 文件 志 疗 传送 数据 ， 没 有 旋 月 级 缓冲， 
它们 对 将 二 进 制 数据 读 写 至 网 络 和 从 网 络 读 写 二 进 制 数据 尤其 有 用 。 
e 带鱼 冲 的 给 入 函数 。 这 些 函 数 多 许 你 高 效 地 从 文件 中 读 加 文本 行 和 二 进 制 数 据 ， 这 些 文件 
的 内 容 缓 存在 应 用 级 缓冲 区 内 ， 相 似 于 为 printf 这 样 的 标准 UO 也 数 提供 的 绥 冲 区 。 与 [81] 
"Pup И ТҮ UO 例 程 不 同 ， 带 缓冲 的 Rio 输入 男 数 是 线程 安全 的 〈13.7.1 节 )， 它 在 
辣 “ 个 描述 符 上 可 以 被 变 错 地 调用 。 人 如， 你 可 以 从 一 个 描述 符 中 该 一 些 文本 行 ， 然 后 读 
取 一 些 一 进 制 数据 ， 接 着 凡 多 读 取 一 些 文本 行 。 
我 们 提出 Rio 例 程 为 了 天 个 原因 : 第 - -， 在 总 下 来 的 两 章 中 ， 我 们 并 发 的 网 络 应 用 中 使 用 了 它 
们 ; 第 二 ， 通 过 学 习 这 些 例 程 的 代码 ， 你 将 对 Unix VO 有 更 深入 的 了 解 。 


11.4.1 Rio 的 无 组 冲 的 输入 输出 函数 
通过 调用 по_теайп 和 rio, weiten 畏 数 ， 应 用 程序 可 以 在 存储 器 和 文件 之 间 直 接 传送 数据 。 










#irclude 'csapp.h" 







ssize t rio readní(int Та, void *usrbuf, size t n); 
sgSize t rio writen(.nt fd, void *usrbuf, size t п}; 


АП): 帝 成 功 则 为 情 送 的 字 节 数 ， 若 EOF 则 为 0 {只 对 rio readn 而 言 》， 若 出 错 则 为 -1， 


rio readn РАЙ АЖАР fd 的 当前 文件 位 置 最 多 传送 п 个 字 节 到 存储 器 位 置 це. ЭШ. 
rio writen 请 数 从 位 置 usrbuf 传送 nn 个 字 节 到 描述 符 fd. rio read 函数 在 过 到 EOF 时 只 能 返 问 一 个 
^R. rio written 函数 决 不 会 返回 不 号 值 。 对 问 :个 描述 符 ， 可 以 仔 意 交错 地 调用 rio readn 和 
rio writen. 

图 11.3 显示 了 rio readn Xl rio. writen 的 代码 。 注 意 ， 如 果 read 和 write 函数 被 一个 从 应 时 程序 
fci e REPRE FE RUE TRUST, REA RET RENT ACE ULM EE B read 或 write。 为 了 尽 可 能 有 较 好 的 十 移 
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植 性 ， 我 们 允许 被 中 断 的 系统 调用 ， 昌 在 必要 时 重 月 它们 。( 参 见 8.5.4 节 中 关于 被 中 斯 的 系统 调用 


的 讨论 。》 








code/src/csapp.c 


S&Size t rio readní(int fd, void *usrbuf, кізе t n) 


{ 


size t nleft = n; 
sa ize t nread; 
char *bufp = usrbutft: 


while (nleft > 0} í 
if ((nread = readífd, bufp, nleft]) < C) I 


9 if {errno == EINTR)  /*intermpted by sig handler retum %/ 

10 nread = 0; Ї* and call read() again */ 

11 else 

12 return -1; /* еттпо set by read() */ 

11 | 

14 else if (nread -- 0) 

15 break; “ EOF */ 

15 nleft -= nread; 

17 bufp += nread; 

18 } 

19 return ín - rleft); /* return >= */ 

20 ] 
cCode/sre/csapp.c 
code/src/csapp.c 

1 ssize_t rio мгікелііпе fd, void *usrbuf, size t n! 

2 | 

3 size t nleft = n; 

4 вөі?е t nwritten; 

5 char *bufp = usrbuf; 

6 

7 while í(nleft > 0] í 

8 if ((nwritten = write(fd, bufp, nleft)) <= 0) £ 

9 if {errno == EINTR)  /*interrupted һу sig handler return */ 

10 nwritten = 0; /* and call write() again */ 

11 else 

2 return -1; /* errorno set by write() */ 

13 ) 

14 nleft -= nwritten; 

15 bufp 4«- nwrilten; 

16 ] 

17 return n; 

18 ) 





code/sreícsapp.c 


图 11.3 по reacdn йо witen 函数 
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11.4.2 Ric BTE АЗ АҒА 

— "P K RA ЕЕ ТН НЫМ ASCI НАНҒА. £ Unix Ж. ИТТ CU 与 
ASCI HITA (LF) 181, ЖЗНЕ 00a Rifle RS PEKAN ЕЕ AK CIE P CASAS S 
数量 ,我 们 该 如 何 来 实现 呢 ? 一 种 方法 就 是 用 read Ж Ж -次 一 个 字 节 地 从 文件 传送 到 用 户 存 情 器 ， 
检查 每 个 字 节 来 查找 护 行 符 。 这 个 方法 的 缺点 是 它 的 效率 不 是 很 高 ， 每 读 取 文件 中 的 一 个 学 节 痢 要 
求 陷入 内 核 。 

-种 更 寻 的 方法 是 调用 包装 《wrapper) ERA. (ro readlinebo, А — TARRA ТАНИ-- 
文本 条 ， 当 拖 冲 区 变 衬 时 ,会 户 动 地 调用 read 重新 填 满 绿 冲 区 。 对 于 既 包 含 立 本 行 也 包含 一 进 制 数 
据 的 文件 “例如 12.53 УЗ БАҚ) HTTP 哆 庶 )， 我 们 也 提供 了 一 个 по readn 79290 АУЛ AS. Ш 
做 rio_readnb， 它 从 和 rio readlineb 一 样 的 缓冲 区 中 传送 原始 字 节 。 


include Сояарр.һ" 





void rio reacinitbírio t *rp, int fd); 


Ін): X. 


sSize t r.o readlinebí(rio т *rp, void *usrbuf, size_t маҳіепі; 
өзіте t rio readnb(rio t Жүр, void *usrbuf, size t n); 


ғы ЖИМ pik TE, # EOF 则 为 0， 落 出 错 则 为 -1。 


每 打开 一 个 描述 符 , 都 会 调用 по, readiniib ЖЖ. 846553 fd 和 地 址 rp 椒 的 一 个 类 型 为 nio_+t 
的 读 缓 痢 区 联系 起 来 。 

rio тайни AAA XE tp 读 出 一 外 文本 行 【包括 结尾 的 换行 符 )， 将 恬 搁 由 到 存储 器 位 置 
usrbuf, JEH nll CT) 字符 来 结束 这 个 文本 行 。rio_readinitb 函数 最 多 读 maxjen-l 个 字 节 ， 余 下 
ЫН ЕРЕН ШЫ maxlen-1 字 节 的 文本 行 被 截断 ， 并 用 一 个 室 字 符 结束 。 

rio, readnb PACA LAE тр 最 多 读 n А У В usrbuf, 对 司 一 拱 述 符 ， 对 rio readlineb 
和 rio_readn 的 调 出 可 以 任意 交叉 进行 ， 然 而 ， 对 这 些 带 缓冲 的 通 数 多 调用 趟 不 应 和 不 带 组 冲 揭 
rio, readn ЖТС X f8 H. 


НЕГЕ 80) ЧЕ ЭА E ËJ Rio EEG. B114 展 水 了 如 何 使 用 Rio 函数 来 -次 
— TH A M VER АБ Л -个 文本 文件 到 标准 输出 。 


code/ia/cpfile.c 
1 tinclude "csapp.h" 
2 
3 int main(int ағас, char **argwv) 
4 l 
5 int 7; 
Б rio E rio; 
7 char Puf [MAXLINE!: 
8 
9 Rio,readinitbi(&krio, STDIN ҒІҺЕМО); 
10 while((n = Rio readlinebi&rio, buf, MAXLINE)! 1= 0) 
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Rio writer(STDOUT FILENO, buf, п); 


code/iorcpfile.c 
ПА 从 标准 输入 拷贝 一 个 文本 文件 到 标准 输出 


图 11.5 展 东 了 一 个 读 尝 冲 区 的 格式 ， 以 及 初始 化 它 的 no readinith рК. rio readinitb rf 
数 创 建 了 一 个 空 的 读 缓 神 区 ， 间 且 将 一 个 打开 的 交 件 描述 罕 和 这 个 缓 促 区 联系 起 来 ， 
Rio ЕВУ E RIF zsjrio read. го read 函数 是 Unix read pA ЖЕРТЕЛЕ НИЕ Ж. 


~1 Cn Ал gm id bo Lr 


іп іл e a b ҥе 





ір» 00 = kr їл gm 4 [м = 


LR prp pP 
dme da) TD на C^ 


code/include/csapp.h 

define RIO BUFSIZE 8192 
typedef struct { 

int rio fd; /* descriptor for this internal buf */ 

int rio cnt; /* unread bytes in internal buf */ 

char *rio bufptr; /* next unread byte in internal buf */ 

char rio buf [КІС BUFSIZE]. /* internal buffer */ 
) rio t; 


code/ include /csapp.h 


code/src/csapp.c 


void rio readinitbi(rio t *rp, int Fd) 
{ 

rp-»rio fd = td; 

rp-»rio cnt = 09; 

rp-»rio bufptr = rp-»rio but; 


code/sre/esapp.c 
图 11.5 一 个 类 型 为 fio_+ 的 读 缓冲 区 和 初始 化 它 的 rio_readinitb 函数 


code/sre/csapp.c 


static ssize t rio readí(rio t *rp, char *usrouf, size - n) 
l 


int cnt; 


while !rp-»rlo cnt «s 0) ( Æ refill if buf is empty */ 
гр->гіа2 cnt = read(rp-»rio fd, rp-»rio, 5uf, 
sizeofí(rp-»rio buf); 

it i(rp-»rio cnt < Ü) I 

if {errno !- EINTR) /*intermpted by sig handler return */ 
return -1; 
) 

else if (rp-»rio cnt == 0) /*EOF*/ 
return Ü; 

сіне 
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15 rp-»rio bufp-r = rp-»rio but; /*reset buffer ptr */ 
16 ) 

17 

18 /* Copy minin, rp-»tio cnt) bytes from internal buf to user buf */ 
19 cnt - n: 

20 if [(rp->rio_2nt < n) 

2L cnt = rp--rio cnt; 

22 memcpy usrbuf, rp-»rio bifptr, cnt]; 

23 ro-»rio bufptr += cnt: 

24 r3-»rio cnt -= cnt; 

25 return cnt; 

25-1 


code/srcfcsapp.c 
Ж 11.6 内 部 的 rio_read 函数 


当 调 用 го read 要 求 读 n 个 字 节 时 ， 读 缓冲 区 内 有 p-ro cent ЖИЕН. ШЕТ. 
奢 么 会 通过 调用 read HARE. Xi read 调用 收 到 一 个 不 足 值 计 不 是 错误 , Н АЛИК ЕЗ 
SU. 且 组 冲 区 非 空 ，rio_read Я MOX Р Л п 和 rp-rio, ent 中 最 小 值 的 字 WERE 
冲 区 ， 并 返回 拷贝 的 字 节 数 。 

HT -个 应 用 程序 ，rio_read 函数 和 Unix read 前 数 有 问 样 的 语 六 。 在 出 错 村 ， 它 返回 慎 -1， 并 
На АҢЫ ГЕ erno. 在 EOF 时 ,， 它 返回 值 0. 如果 要 求 的 字 节 数 起 过 了 读 钥 冲 区 内 林 读 的 字 节 的 数 
量 ， 它 会 返回 一 个 不 是 但 。 ЕЖЕН ЕНЕ ЗІМ по read 代替 read 来 创建 不 局 类 型 
的 带 组 部 的 读 前 数 。 倒 如， 用 ло read fÉ геаа. 图 11.7 中 的 rio_readnb 函数 和 rio readn 有 相同 的 
结构 。 相 似 地 ， 图 11,7 中 的 rio_readlineb EFE ILE rio. read maxlen-1 Ж. SEXUAL ҖАЕ 
区 返回 -个 字 节 ， 然 后 会 栓 信 这 个 字 节 是 否 是 结尾 的 换行 符 。 





code/sre/csapp.c 


1 S8ize t rio readlinebirio t *rp, void *usrbuf, size t maxlen) 
2 1 

3 añt n, rc; 

4 char c, *bufp = usrkbuf; 

5 

б for (п = l; n < naxlen; пә) 1 

7 1Ë lire = rio readirp, ас, 1)) == 1) 1 

8 *bufpes = c; 

9 ІР (c == 'Mn') 

10 break; 

1- } else if (rz == U; 1 

12 if (n == 1) 

13 return 0; — Æ EOF, по data read */ 

14 else 

15 break; /* EOF, some data was read */ 


16 } else 


17 
18 
13 
20 
21 


Ы BÀ B RS DLE LD oe =] c ІЛ ag n Го rS 
іп іс FPE LS E 


一 = њ oH 
ышы ба м1 h 


B2 
Ll 
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return -1; Ж eor */ 
} 
*bufp = 0; 


return n; 


code/src/csapp.c 
code/sre/csapp.c 
sslze t rio readnb(rio t *rp, void *usrbuf, size t n] 
{ 
size t nlefr = n; 
ssize t nread; 
char *bufp = usrbut; 


while (nleft > 0) { 
if ((nread = rio readirp, bufp, nleft)) < O) { 
if (егіпо == EINTR) /* mterrupted by sig handler return */ 


nread - 0; 1% call read() again */ 
else 

return -1; /* errno set by read() */ 
) 
else if í(nread == 9) 

break; /* EOF */ 
nleft -- nread; 


Dufp += nread; 
} 
return (n - nleft); /* return >= 0 */ 


codersrc/cyapp. с 
11,7 По readlineb Ж го readnb Ж 


Sut. Rio (ism 

Rio 45% h + W. Richard Stevens ЖЫНЫ Ж llo PUE ES [8 1] P КӨ) readline、readn 
和 writen 18, rio. readn 和 rio. writen 8.5 Stevens 的 readn 和 writen 505-968), ЖЖ, Stevens 
的 zeadline ARE — ERME Rio dH 431 T p| E. Ж-, Б radie ЖФ, m Teadn ЖФ, Я 
以 这 两 个 函数 不 能 在 同一 描述 符 上 一 起 使 用 , #7, PEU ФАНО IE, Stevens 的 readline 
ЗИЛАН, MEG Stevens 引入 一 个 不 回 的 线程 安全 版 本 ， 称 为 readline r， 我 们 已 经 在 
rio readlineb 和 rio_readn Ж FEAT HAAR, ВАЗАЛНЕ НАНЕ А. 


11.5 


RANTRE 


ARE HE CIE EUR Fj stat 和 fstat АЖ, ARAF EE ABRAHA, 


metadata ). 
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*inLclude «unistd.h- 
include «sys/stat.h- 


int Statí(const char *filename, struci stat *bufi; 
int fstatí(inL fd, struct stat *buf)!; 


ағ); SAMA 0, Edd». 





stat РАЗ Д КСЕ ТЕ ЗТ А. 并 填写 如 图 11.8 所 示 的 一 个 stat 数据 结构 中 的 各 个 成 员 。fstat 
质数 足 相似 的 ， 具 不 过 是 以 文件 描 过 符 而 不 是 玄 件 名 作为 输入 。 当 我 们 在 12.5 季 中 讨论 Web 服务 
ЖЫ, СЕ stat 数据 结构 中 区 st mode 和 st size RA. HERRITAR EZ. 
mm —— Р includeed by sys/stat.h) 


/* Motadata returned bv the stat and fstat functions */ 
struct stab | 


dev t at dev; /* device */ 

ino t at ino: /* inode */ 

mode t st mode: /* protection and file type */ 
nlink t st nlink; /* number of hard links %/ 

uid t at uld: /* user ID of owner */ 

gid t St gid; /^* group ID of owner */ 

dev t st rdev; /* device type lif inode device! */ 
off.t St віге; /* total size, іг bytes %; 
unsigned lonj st blksize; /* blocksize for filesystem T/O */ 
unsigned long st, blocks; /% nunber of blocks allocated */ 
time t st atime; /* tine cf last access */ 

іме t st mtime; /* tine cf last modification %/ 
time t s- сілте; /* time оі last change */ 





siatbuf.h(includeed bv svs/staLh) 
图 11.8 stat 数据 结构 


st size AAAS ТЕНЕ Ya K]. st mode 成 员 则 编码 了 文件 访问 许可 位 【图 111) X 
件 类 型 。Unix 识别 大 量 不 同 的 文件 类 型 。 普 通 文 件 包 括 某 种 类 型 的 二 进 制 或 交 本 数据 。 对 于 内 核 而 
=, 文本 文件 和 二 进 制 文件 毫 无 区 别 。 司 录 文 件 包含 关于 其 他 文 忻 的 信息 。 套 接 字 是 一 种 用 来 通过 
Мақ ЕНЕ ЖЕ. 

Unix 提供 的 宏 指令 根据 st mode ӘЖЕ НІНЕ, BE 119 列 出 了 这 些 宏 的 一 个 了 集 。 


这 是 Еа УЦ? 


这 是 个 目标 文件 吗 ? 
5_1850СХ{} АЙ MAE EHT M 


图 11.” 根据 斗 mode 位 确定 文件 类 型 的 宏 指 令 





在 sysistal.h T E X 
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图 11.10 展 示 了 我 们 会 如 何 使 用 这 些 宏和 stat 图 数 ， 来 读 和 让 和 解释 一 个 文件 的 st mode 位 。 


code/i/statcheck.c 


1 finclude "csapp. h" 

2 

3 int тајп [int згас, char **атту) 

4 { 

5 struct stat stat; 

6 char *type, *readok; 

5 

B Stat(argv[1], &stat)!; 

9 if (5 ISRES[stat.st mode)) /* Determine file type %/ 
16 күре = "regular"; 

11 else if (S ISDIRistat,.st model) 

12 type = "directory"; 

13 else 

14 type - "orher"; 

15 if ¿(star st mode k S TRUSR)) /* Check read access */ 
16 readok = "ves"; 

17 else 

18 readok = "по"; 

19 

20 printf("type: $s, read: %в\п", type, readok); 
21 exit (0); 

22 } 


code//statcheck.c 


图 11.10 查 向 和 处 理 一 个 文件 的 时 mode 位 


116 ”共享 文件 


可 以 用 许多 不 同 的 方式 来 其 学 Unix X f. 除非 你 很 清楚 内 核 是 如 何 表 示 打 开 的 文件 , 否则 文件 
共 学 的 概念 相当 难 局 。 内 和 祸 用 二 种 相关 的 数据 结构 来 表示 打开 的 文件 : 

e ЖАН (descriptor table )。 每 个 进程 都 有 它 独立 的 描述 符 表 ,， 它 的 表 项 是 由 进程 打开 的 文 
件 描述 符 来 索引 的 。 每 个 打开 的 描述 符 表 项 指向 文件 表 中 的 一 个 表 项 。 

e 文件 表 (Cile table)。 打 开 文 件 的 集合 是 由 一 张 文 件 表 来 表示 的 ， 所 有 的 进程 共享 这 张 表 。 
每 个 文件 表 的 表 项 组 成 《针对 我 们 的 月 的 ) 包括 有 当前 的 文件 位 置 、 引 用 计数 〔reference 
count》 即 当前 指 问 访 表 项 的 民 述 符 表 项 数 ， 雇 及 一 个 指向 v-nede 表 中 对 应 表 项 的 指针 。 关 
及 一 个 描述 符 会 减少 相应 的 文件 表 表 项 中 的 引用 计数 。 内 核 不 会 删除 这 个 文件 表 表 项 ， 直 
到 它 的 引用 计数 为 零 。 

• vnode Ж. (v-node table )。 同 文件 表 一 - 样 ， 所 有 的 进程 共享 这 张 v-node 表 。 每 个 表 项 包含 
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stat МІН ХЕЗНАН, BIA st mode 和 St size 成 员 。 
图 11.11 RRT o. H hit 1 和 4 ЧУЛЕР] JEX PEOR DESIT TS SIBI X 
fr. АНИЯ, WAER, XBSofRSN—TMPJIExI. 





描述 符 表 IH XI S V-node X 
"MEE Җ (所 有 进程 基部 ) (所 有 进程 此 部) 
文件 A EE 
stdin 100 — | — 3C 5 In] 
stdout 102 | A aa 
ЖҮНУЕ 
Mud Wa" 224 refent-l| | 交 性 类 型 | 
H4 — t | : | 
{В _ 
а, М а 


DRE 








图 11.11 典型 的 打开 文件 的 内 核 数据 结构 
企 这 个 示例 中 ， 两 个 描述 符 丰 用 不 同 的 误 件 ， 没 有 共享 ， 
ШЕ 11.12 所 4， 泌 个 指 述 符 也 可 以 通过 不 同 的 交 忻 表 表 项 来 引用 同一 个 文件 。 倒 如 ， 如 果 以 
F] :个 文件 名 调用 open RAAK., 号 会 发 生 这 种 情况 , 关键 思想 是 每 个 描述 符 都 有 它 白 己 的 文件 位 
Е, СДУ ТЕЗ АУЕ ТЕ П АЗСА ТОКЕ ЕЕ ИЕ. 


措 述 罕 表 HT aE V-node Б 
CHAH AR) (НГ) (Bra sit fe ДЕ) 







BLEI 





KERM 





YE 


reBtecnb-1 






图 1112 文 斗 共享 
六 个 例 耻 居 示 了 两 个 描述 符 通过 册 个 打开 文件 表 表 项 共享 同 TES KE. 


找 们 也 能 理解 父 了 进程 是 如 何 共 享 交 件 的 。 假 设 在 调用 fork 之 前 ， 祥 进程 有 如 图 11,11 所 未 的 
打开 文件 。 这 时 ， 图 11.13 ЕТТИН fork 后 的 情况 ， 

子 进 程 有 一 个 多 进程 描述 符 表 的 天 本 。 父 子 进程 共享 相同 的 打开 文件 表 集 合 ， 因 此 具 剖 相同 的 
XE. 个 很 重要 的 结果 就 是 ， 在 内 核 删除 相应 文件 表 表 项 之 前 ， 父 了 进程 必须 者 关闭 了 它们 
Kr n. 


K. LL UO 


RE 打开 文件 表 
(所 有 进程 共享 ) 
父 进程 的 赤 А 





{а 


x 









683 


V-node Ж 
(ТЕН) 





文件 访问 | 
文件 大 小 





图 11.13 ТИЕ СЕТІН 


初始 状态 如 则 1111 所 示 。 


练习 题 11.2 
TE Bi dE LE foobar.txt 由 6 个 点 SCIT AFA “foobar 组 成 。 那 么 ， 下 列 程序 的 输出 是 件 各 ? 


1 Kinclude "csapp.h" 

2 

i int mainí! 

4 { 

5 int 181, Ғаз; 

5 char c; 

7 

3 idi] = Open["foobar.txt", О RDONLY, 
3 Ғс2 = Орепі"Гоооаг.їхі", O RDONLY, 
10 Readíidl, &c, 1); 

11 Readi(fd2, &c, 1); 

12 printfí"c = %с\п", c); 

13 exit(0); 

l4 ) 

* 3E 11.3 


W R 9 ФАН, «БНАЖ foobartxt 出 6 个 ASCH AFTA “foobar HEA.. 
输出 是 什么 ? 


1 
2 
i 
4 


finclude 'csapp.h" 


int main(ít! 


[ 


d]: 
0); 


那么 下 列 程序 的 
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5 int EG; 

b char c; 

Е: 

Н fd = üpení"Ioobar.txt", O RDONLY, 0); 
9 if (Fork == 0) Í 

10 Read(fd, вс, 1); 
11 ех1і (0); 

12 } 

13 Walt INULL); 

14 Hcadifd, кс, 1); 

15 printfí"c = %с\п", с); 
16 exit (0); 

17 | 


11.7 UO 重 定 向 
Unix shell 提供 了 DLO 重 定 向 操作 符 ， 多 计 用 户 将 磁盘 文件 和 林 准 笨 六 输出 联系 起 米 。 例 如 ， 键 六 


Unix» ls > foo.txc 
使 得 shell 加 载 和 执行 15 EFF, НЕНІ ШЕ ERE УР foot. 就 如 我 们 将 在 12,5 节 中 看 到 
的 那样 ， 当 “个 Web PR32849 ЖЕРІ CO BOTH. CAR ALANNE E n ДИЛ 
VO ЖЕ | ж] LERE? 一 种 方式 是 使 用 dup? ра. 


Sinclude zunistd.h- 


int dup2(int oldfd, int newfdi'; 





EE, ЖАУЫН CASS RS, ЖҢЯНЯ-І. 


dup? 函数 据 由 描述 符 表 表 硕 oldfd 到 描述 符 表 表 珊 newfd, ЖАЛЫ А newfd 以 前 的 内 
Ж. ME newfa 已 经 打开 了 ，dup2 会 在 拷贝 oldfd 之 前 关闭 newtd. 

BORAR 由 p2(4.0) 之 前 ， 我 们 的 状态 如 图 1i.11 Ғы, ЛЕРІ 《标准 输出 ， 对 应 于 文 
人 忻 太 (比如 说 一 个 终端 )， 漠 述 符 4 对 应 于 文件 B 《比如 说 一 个 磁盘 文件 )。A 和 B 的 引用 计数 都 等 
于 1。 图 11.14 Ss T WPJ dup2(4,1) 之 万 的 情况 。 曲 个 描述 符 现在 如 指 癌 旦 ， 交 什 A 已 经 被 关闭 了 ， 
并 月 它 的 文件 表 和 v-node K 2746 B ЖГ; 文件 B 的 引用 计数 已 经 增加 了 ,从 此 以 后 ,任何 写 
到 标准 输出 的 数据 都 被 重 定 辐 到 文件 В. 
凌 注 ， 左 边 和 右边 的 hoinkies. 

为 了 避免 和 其 他 括号 类 型 操作 符 比 如 "I" de "D 398, T EE Xp ES O^ RERA 
“Ж hoinky", £m С ЖЕД) “ЖЯ hoinky", 


ЖУ 11.4 
如 何 用 dup2 AUR АЕ Ж 6) 8| VEM 5? 
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ЖТ] E 打开 文件 志 V-nodie Ж 
“每 个 进程 - 张 志 ) ( 所 有 进程 共享 ) 《所 有 进程 共享 ) 
ЕК} А 
0 A Q ТОНЕ 
91 文件 位 置 | 文件 大 小 | 
@3 Prefcnt-0 | .文件 类 型 
fd 4 ， 


T---44J8HHEJ- La ---4-4 LLLNRAJ и 










i 变性 位 置 


refent=2 i 


图 11.14 通过 调用 Gup2l4.1) 重 定向 标准 输出 之 后 的 内 核 数 据 结 构 
初始 状态 如 图 11.11 所 示 。 


练习 题 11.5 
假设 磁盘 文件 foobartxt Н 6 + ASCI 码 字符 “foobar” 组 成 ， 那 么 下 列 程序 的 输出 是 什么 


1 Яілсізсде "csapp.h" 

2 

3 int таілі) 

4 { 

5 int ІЗІ, fà2; 

6 char c; 

7 

В fdl = Opení('foobar.txt", O RDONLY, 0); 
9 Гао = Opeu('foobar.txt", O RDONLY, 0); 
16 Readifd2, кс, 1]: 

11 Dup2ifd2, £d1); 

12 Read(fdl, Ес, 11; 

13 printf("c = ӛсіп", с): 

14 exitii); 

i5 } 


118 标准 |/O 


ANSI C 定义 了 一 组 品级 输入 输出 函数 , 称 为 标准 VO Ж. 为 程序 员 提供 了 Unix ОЮ НАУ 
的 接口 。 这 个 库 (libc》 提 供 了 打开 和 关闭 文件 的 水 数 (fopen 和 felos), WASHA (fread 
和 fwrite) i NIS TIRRAN (gets 和 fpots)， 以 及 复杂 的 格式 化 VO АЖ Cscanf 和 print). 

标准 WO 库 将 一 个 打开 的 诡 件 模型 化 为 一 个 流 。 对 于 程序 员 而 言 ， 一 个 流 就 是 一 个 指向 类 型 为 
FILE 结构 的 指针 。 每 个 ANSI C 程序 开始 时 都 有 二 个 打开 的 流 stdin, stdout 和 stder， 分 别 对 应 于 
标准 输入 、 标 准 输出 和 标准 错误 ; 
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linciude «sLdio.h» 


extern FILE *stdin; /* standard input [descriptor 0) */ 
exLern FTLE *stdout; /* standard output ‘descriptor 1) #7 
extern FILE *siderr; /* standard error (descriptor 2! *»/ 


类 型 为 FILE AA EA ИЖ ПАЛЕ p ЕРЕН. ACER PCI H RA Rio ИИК 6 - 
ҚМК Unix ПОНИ ЕЛЕНЕ. Plan. ERRUA AET. БМ 
标准 ТО gete ЖШ, 每 次 调用 返 同 文件 的 下 一 个 学 符 ; 当 第 ЧАН] gete 时 , 库 通过 调用 iR read 
冰 数 米 填 充 流 缓冲 长 ， 然 后 将 缓冲 区 中 的 第 一 个 字 节 返 回 符 应 用 程序 ， 只 要 缓冲 区 中 偿 有 本 该 的 池 
17, Ж F3K A] gete TS FH ЗАЕНЕН АЛЕН РІНЕ 55 , 


11.9 综合: 我 该 使 用 哪些 VO E 
图 11.15 总 结 了 我 们 在 这 - 章 电 过 沦 过 的 各 种 JO М. 


fopen fdopen 
fread fwrite 
fscant fprintf 


sscanf ергіпЕ 
fgets Ёре з 
Eflush isgeek 
tfclose 


СН 


rio readn 
rio writen 





rio readinitb 


У bh VO важ RIO $ 


rio readlineb 


open тела rio readnb 
write Ілеек Unix VO B 
stat  — close (通过 系统 请 用 来 访问 ) 





图 11.15 Unix 1OQ、 标 准 VO 和 和 Rio 之 间 的 关系 


Unix LO 是 在 霸 作 系统 上 内核 中 实现 的 。 庶 用 程序 可 以 通过 орел. сіоѕе. 1ѕеек. гсай ЖІ write 这 
样 的 函数 米 访 问 Unix ТО. S2 5 283 Rio 和 标准 VO vA 38 ñB EET CIE FD Unix МО AROR AHH . 
Rio Hi EE Kh TEX] read 和 write 的 健壮 包装 【wrapper) АЖ. ELIT S IRE AS А {И (short 
counts), ЖЕН Arie X RAT BE ЖАН ЖАНЫН 2 aniy ЛТА. БОЕ UO РАЙ 7 Unix VO к 1 
ИЛЕ VPE. Bid yop. 

AA. CRETE ТАЕ РЕ СК Erb ONE CNET 标准 VO W N P 635 ЛЕН ES UO 205. 
ҚОШ C FUIT vi АНМЕН ЛЕУ Е ELS Hte VO. rfi M ЖР ALICE Unix VO p. NEn НЕ, 
ПЖ TEIR ER FFIR 

术 闻 的 是 ， 当 我 们 试图 对 网 络 输入 输出 征用 标准 VO В, БАНЕ Г EA AHRI RH. uf 
BRIE 12.4 PATRI, Unis 对 网 络 的 抽象 是 -НЯЛЕЗТІҢ ІР. AAEM Unix 
文件 一 行 ， 符 接 字 也 是 用 文件 描述 符 来 引用 的 ， 在 这 种 情况 中 被 称 为 天 接 字 描述 蔡 。 应 用 进 得 通过 
谈 扎 套 扶 字 描 述 符 来 与 运行 在 其 他 计算 机 上 的 进程 通信 。 

慰 准 LOU АКЕ А ЕПА г ДЧ, EATR А] gd ГТ HW di. Ж 
ІШ, НОНХЛТЕВЖЖЕ Т HB: 

. RE- RARIOR S АК Б, STR DORT ИД АЯ fflush. Беек. fsetpos 成 者 rewind 


系统 级 UO 587 


的 调用 ，- МААРА ЕЕ ВИР ER EO Ks fush ЖЕ НИН КЕНІН 
iei - T eR ИЕ Unix LO lseek ЖЕКЕЛЕУ ҒЫН. 
e 限定 二 : H VA EE EC, W k lH АА Ши, fseek, fsetpos wA rewind 
的 调用 ，- ИШ eR SURE RR BR D COR LZ е, АНЕ А. ОВА Т-Н 
x. 
这 些 限 制 给 网 络 应 用 带 来 了 一 个 器 题 ， 因 为 料 套 接 字 使 由 lseek ЖА IRER. 对 流 UO 的 第 一 
个 限定 能 钵 通过 采 有 几 在 每 个 输入 操作 前 刷新 组 剖 区 这 样 的 规则 来 保证 实现 ， 然 而 ， 保 证 实现 第 二 个 
BERE 办 法 是 ， 对 辣 - -个 提 并 的 食 接 字 摊 述 符 打开 册 个 流 ， 一 个 用 来 读 ， СНЖЕ: 


FILE *fpin, *Їроїї; 


їрїп = fdopenisockfa, "г"); 

fpout = fcopen(sockfd, "w"; 

ЇН DURER МА, БЕ КҮН] ДЕНЕ (EPA AC ILES ЖЛ] flose， 这 样 才 能 释放 与 每 
TAARKA Та атала MES NI E DT 

fclose;ifpinl; 

fcloseifpoul); 

这 些 操作 中 的 每 一 个 部 试图 关 采 同一 个 底层 的 套 接 字 描述 符 ， 所 以 第 二 个 close 操作 就 会 失败 。 
灶 顺 序 的 称 序 束 次 ， 这 并 洒 是 问题 ， 租 是 在 “个 线程 化 的 【threaded) 程序 中 关闭 - 个 已 经 关闭 了 的 
ШЖ s САЖ EA 1374 W), 

ЯШ, КІЛЕНРИЛМЕН E HEEL ЕЩЕ IO 函数 来 进行 输入 和 输出 ， 而 要 使 用 Rio ifi 
数 。 和 如 果 你 需要 格式 化 输出 ， 使 用 sprintf 舟 数 在 存储 器 中 格式 化 .个 字符 串 ， 然 后 用 rio_writen 把 
АТ, METRIS SER АША. ЖЕЛ] rio readlineb 来 读 -- 个 完整 的 文本 行 ， 然 后 用 scanf 
从 文本 行 提 取 不 同 的 字段 。 


11.10 


Unix Е он, lt HEEPF3 R. ЖИ. НЕСЕ, ЖУ ИЛ 
di. ARRIT ГО X, Unix ЛЕН W 4EZ25 HI ЛДЕН (short counts)， 应 用 程序 必须 能 正确 地 
ПИЖАН НЧЕ, БУН ГЕЛ НЕШ Н Unix VOS. mE Н Rio f. Rio 包 通 过 反复 执 
{ТЖ ЗА, ЕЗІНІҢ K is, НАНЫН АДАМ, 

Unix 内 核 使 用 三 种 相关 的 数据 结构 来 表示 打开 的 交 件 。 措 述 符 表 中 的 表 项 指向 条 开 文 忻 表 中 的 
RIM, ПТ ЕТЕТІН ЕН УАҢ v-node 表 中 的 表 项 。 每 个 进程 都 有 它 和 白 己 单独 的 描述 符 表 ,而 
MA TEER S i—i ARA v-node Æ. 理解 这 些 结构 的 一 般 构 成 就 能 使 我 们 清楚 此 理解 交 忻 
КЕН UO Su s. 

WHE IO A: EY Unix VO 实现 的 ， 并 提供 了 一 组 强大 的 高 级 VO ШЖ. XET Kd H EST 
而 言 ， 标 准 WO 更 简单 ， 是 优 于 Unix ТО 的 选择 。 然 而 ， 因 为 对 标准 WO 和 网 络 交 件 的 -一 些 相 直 不 
兼容 的 限制 ，Unix IO 比 之 标准 VO 更 该 适用 寺 网 络 应 用 程序 。 
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参考 文献 说 明 
Stevens 编写 了 Unix UO 的 标准 参 蔷 文献 [76]。Kernighan 和 Ritchie 对 于 标价 ГО ЖЕН 了 清 
晰 而 完整 的 讨论 f40]。 
家 庭 作 业 
1.6 € 
下 面 感 日 的 输出 是 什么 ? 
#include "csapp.h' 
int mainí) 


{ 
int Га1, fd2; 


Ca cà £m АЛ Къ L2 л p 


fdl = Openi"'foo.Ext", о RDONLY, 0}; 
fd2 = Open!'bar.txt", O RDONLY, 0}; 
Close[fd2]; 


ып 


10 id2 = Ореп("Бах.іхї", О RDONLY, ©); 
11 printfi("fd2 = &dn", [42}; 

12 ехі {0}; 

13 } 

117 Ф 


МН 11.4 中 所 示 的 cpfile 程序 ,使 得 它 用 Rio ER ААК LPS ЖЕ ИШ. ЧК MAXBUF 
TET, 

118 %% 

ЗІҢ 11.10 中 的 statcheck 程序 的 一 个 版 本 ， 叫 做 fstatcheck, Мг С -个 描述 符 数 
字 而 不 是 艾 件 名 。 

119 e 

考虑 直面 对 习题 11.8 中 的 对 fstateheck РРЛ Н: 

unix» fstatcheck 3 < foo.txt 

你 可 能 会 预想 这 个 对 fstateheck 的 调用 将 提取 和 显示 文件 foo.txt 的 元 数据 。 然 而 ， 当 我 们 在 我 
们 的 系统 上 运行 它 时 , 它 将 失败 , 返回 * 坏 的 文件 描述 符 ”, 根据 这 种 情 交 ,填写 shell 在 fork 和 execve 
НІН АТ ТИАН: 


if iFork() == 0) { /* child */ 
/* What code is the shell executing right here? %; 
Execve("fstatcheck", argy, envp); 

} 


11.10 499 
ЕЕЕ ПАТ epfile EIE, {ЧЕН Aoii nfl. WRSET infile, ЖАН 
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贝 іше Ж Л ИШ. ЖАНЕ Л ИЕ АБИЕВА Н — T EDIGEXN TAR. ХВЕ 
答 都 必须 使 用 原来 的 拷贝 循环 〔 第 9 一 1 行 )。 只 允许 你 插入 代码 ， 而 不 允许 更 改 任何 已 存在 的 代码 。 


练习 题 答案 


5 3188 11.1 答案 
Unix 进程 生命 周期 开始 上 时， 打开 的 挤 述 符 赋 给 了 stdin 《描述 符 0), stdout (描述 符 1) 和 stderr 
(描述 符 20. open 出 数 总 是 返回 最 低 的 未 打开 的 描述 符 ， 所 以 第 一 次 调用 open. 会 返回 描述 符 3. 
调用 close ЖЕ ЕДИ ИША 3. ВА open 的 调用 会 返回 描述 符 3， 因 此 程序 的 输出 是 “fd2=3”， 


练习 题 11.2 答案 
描述 符 fdl 和 162 每 个 都 有 各 自 的 打开 文件 表 表 项 ， 所 以 每 个 描述 符 对 于 和 obartxt 都 有 它 自 己 
的 交 件 位 置 。 因 此 ， 从 fd2 的 读 操 作 会 读 取 foobartxt ВУЖ 77, ESTE 


С = Ё 
MAERA ЁЛ T ВЕЛЕ ВУ 


C = Q 


练习 题 11.3 答案 

吓 相 一 上， 子 进 程 会 克 承 侈 进 程 的 描述 符 表 ， 以 及 所 有 进程 共 划 的 同一 个 打开 文件 玫 。 因 由 ， 
描述 符 fa 在 父子 进程 中 都 猎 向 同一 个 打开 文件 表 表 项 。 当 子 进程 读 取 文件 的 第 一 个 字 季 时 ， 文 件 位 
置 加 1。 因 此 ， 父 进程 会 读 取 第 一 个 字 节 ， 而 输出 就 是 


Сол 0 


练习 题 11.4 答案 

重 定 问 标 谁 输 入 (描述 符 0) 到 描述 符 5， 我 们 将 调用 dup2(5,00 2 A 0 
dup2(5,STDIN FILENO). 

55 5] 8E 11.5 答案 

B — B8 15 2: 4434 E RV iZ E 

С = f 

但 是 内 为 我 们 将 fal Же Г fd ， 输 出 实际 上 是 


C = б 
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БАЛУАН, TAHR Іі Web. AXE email 信息 或 者 弹出 - -个 X window, fot iF (d 
使 用 -- 个 网 络 应 用 称 序 。 有 趣 的 是 ， 所 有 的 网 络 应 用 都 是 基于 相同 的 基本 编 种 模型 ， 有 者 由 亿 的 整 
MWoE SE. JE RU RT ЧЕП. 

FUR HS Hc T- 48 ИЗЕП ЖЕНЕ ЕЕЕ ЕУ ШЕЕ. NOn. ЯН. GS. ЖИН. 
存储 器 (memory》 ЯРО Abo NU. Р BEAR. МЕРТ ЖІ а. UAE 
一 些 新 的 概念 。 BE ERR Pa 服务 器 编程 模型 ， 以 及 如 何 编写 使 用 因特网 提供 的 服务 
的 客户 端 - 服 务 器 和 程序。 最后， 我们 将 把 所 有 这 些 概念 铺 合 起 来 ， 开 发 一 个 小 但 是 功能 章 伞 的 Web 
服务 器 ， 人 能够 为 真 炎 的 Web 浏览 器 提供 蔚 态 和 动态 的 文本 和 图形 内 容 。 


12.1 客户 端 - 服 务 器 编程 模型 


每 个 则 络 应 用 都 是 基 十 客户 端 -服务 器 模型 的 。 椒 据 这 个 模型 ， 一 个 应 用 是 由 个 服务 器 进程 
和 个 或 者 多 个 客户 端 进程 组 成 。 服 务 器 管理 某 种 资源 ， 并 通过 操作 这 种 资源 来 为 它 的 客户 山 提 
供 某 和 服务 。 例 如 ， 一 个 Web 服务 器 管理 了 一 组 磁盘 文件 ， 它 会 代表 客户 端 进行 检索 和 执行 ,个 
FTP 服务 器 就 管理 了 一 组 磁 疗 文件 ， 它 会 为 客户 端 进行 存储 和 检索 . 相 亿 地 ， 个 电子 邮件 服务 器 
管理 了 - 些 立 件 ， 它 为 客户 端 进行 读 和 更 新 。 

客户 端 - 有 上 服务器 模 才 中 的 基本 操作 是 事务 《transaction) СЕ 12.1)。 “个 客 访 端 -服务 器 事务 出 
四 步 组 成 ， 

l. 当 -个 客户 端 需要 服务 疏 ， 它 向 服务 器 发 送 一 个 请 求 ， 发 起 TEX. 0100, "3 Web 浏览 
dO CEH CRRA 个 请 求 给 Web 服务 器 ， 

2 服务 器 收 到 请 求 后 ， 解 释 狐 ， 并 以 适当 的 方式 探 作 它 的 资源 ， 例 如 ， 当 Web 服务 器 收 到 浏 
览 器 发 出 的 请 求 后 ， 它 就 读 TE XU. 

3. 服务 器 给 客户 疯 发 送 一 个 响应 ， 并 等 待 卜 -个 请 求 . 例如 ， Web Bre X PF ACIE hr. 

4. АРЫНЫ АҒЫ. Bh. "5 Web КИН сл, ЙЫН. 


L 客户 端 发 送 请 来 
yo 
пир AREE 


图 12.1 “一 个 客户 端 -服务 器 事务 
认识 到 客户 妆 和 服务 器 是 进程 , 而 不 是 在 本 上 下 文中 常 被 称 为 的 机 器 或 者 主机 , 这 是 很 重要 的 。 
一 台 主 机 可 以 同时 运行 许多 不 同 的 客户 端 和 服务 器 ， 而 几 客 户 端 和 慑 务 器 的 事务 由 以 在 同音 或 是 
个 回 的 主机 上 ， 无 论 窜 己 端 和 服务 器 是 怎样 跑 射 到 证 机 上 的 ， 窝 己 喘 - 虐 务 器 愤 地 是 相同 的 。 
旁 注 ， 客 内 端 - 服 务 串 事 务 与 数据 库 事 务 


客户 端 -服务 器 事务 不 是 数据 库 事 务 ， 而 且 也 没有 数据 库 事务 的 特性 ， 例 如 原子 性 。 在 我 们 的 上 
下 文中 ， 事 务 仅仅 是 客户 端 和 服务 器 之 问 执行 的 一 系列 步 骆 ， 
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122 网 络 


客户 喘 和 服 劳 器 通常 运行 在 不 同 的 主机 上， 并且 通 过 计算 机 辐 络 的 硬件 和 较 件 资源 来 通信 。 同 
堵 是 复杂 的 系统 ， 在 这 里 我 们 只 组 了 骨 一 点 皮毛 。 我 们 的 目标 是 从 程序 品 的 前 度 丛 你 一 个 可 工作 的 
思考 模型 。 

对 于 一 个 主机 而 言 ， 网 络 内 是 叉 一 种 TD 设备 ， 作 为 数 滩 源 和 数据 接收 奋 ， 和 如 图 1 了 所 示 ， 一 
ЕН VO. 意 线 扩展 梢 的 适配器 提供 了 到 网 络 的 物理 擂 口 ,从 网 络 上 接收 到 的 数据 从 适配器 此 过 VO 
和 存 铺 器 总 二 持 贝 和 到 存储器 ， 幅 型 地 是 通过 ОМА CHEESE MEUS SO e. diim, Bug 
iE M, f£ fg EU UI REI ER. 





біз | meum 


Who HA и, 


122 一 个 网络 主机 的 硬 忻 骨 成 


物理 上 而 言 ， 阅 络 是 一 个 技 照 地理 远 近 组 成 的 屁 次 系统 。 最 低层 是 LAN (Local Area Network. 
局 起 网 )， 范 围 在 一 个 建筑 或 者 校园 内 ,迄今 为 止 ,最 流行 的 局 域 网 技术 是 以 去 同 [Ethermet)， 它 是 
由 育 祭 公司 帕 洛 阿 乐 托 研究 中 心 CXerox PARCO 在 加 世纪 70 年 避 中 期 提出 的 ,以 坟 网 技术 被 证 明 
在 ЗМ = Ghis 之 间 都 是 相当 适 音 的 ， 

“МАҚЫН (Ethernet segment) 世 括 一 些 电 拆 C jt R xig Ж-Е fk T. 
如 图 12.3 Bro. ELE PMBESE Е 7—1, Dimba y) Bj ABEL. ты 
+ ЖН K ayy, W APAQ IO0Mb/s 或 者 Gbe. — HERI ЕШ Т. DS 3 
ШЕП ЖКН TROE. EMT pod ИНЕ И — А Lai Ж BUR НЕ FRE W 
AL. Wie. SEMEEN Т 

ЫШ ЖАЮ ЖШ TERE 7 09 48 位 地 址 , yh ik АО ЕИ A PETA Р. 一 
п ЕЙ R ЛЕ Rin EAD (fame? BüxdH MERI AEGTEE. Teide ur mti 
8 (header) fr. Fixe iR Hc E КЕҢ А ЖИК ERE, Ui c CREDI ИЖ 8 
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图 12.3 以 太 网 分 段 


司 几 一 些 电 毁 和 由 做 则 桥 (bridge) 的 小 全 ^. E SULLA ЫП UE US АЛЫН. ЖОМ 
桥接 以 太 网 (bridged Ethernet)， 如 图 124 所 小 。 БЕД ЖЕ RE Ee Ж ЕЛЕ ЛД УХ. IE T 
BIELAWIE, - 些 电 比 和 连接 网 桥 与 网 桥 ， 而 另外 一 些 连 接 网 桥 和 和 集线器。 这 些 电 缆 的 带宽 可 以 是 
Аы. БАША. МЕНЕН ПЕН 1Gb/s FEES ПЛИТА ДЕ fn] LAS 
(pr АП S 100Mb/s. 





100 Mb/s 


1 Gb/s 





6124 桥接 以 太 网 

BERR НІҢ АЕ. 利用 一 种 聪明 的 分 配 算 和 法， 它们 随 背 对 间 日 动 学 习 哪个 
TALI EUR ТАБ s C uA. ЖАЛЫНМЕН, НЕН АНДА ЫНЫ. PU, H 
ETELA АЈ ШТЕР DENT PLB. uq SUE EX ТН АЛЫШУ. EAE. [АГ v 
ЯГА СЧ, 然而 ,如果 主机 A RE АТ ЮС. НААХ 112 
TP Hoc Vi 31 cfe ҮНҮН b. FEET Y e H fene UL] ЕЙ. С АЕ ЯЕ Г. 

Aj V ib НЫМ e s.t E HL SE et a RT PEE CLR E ТП ШШЕ БУ- - 根 水 平 线 , ШІК 125 
Brass 

ЕРТЕ Н ИН, КАО АЕ АЫ п Pos ir ut dips 5 Crouter? 的 特殊 计算 机 连接 起 
Ж, ЗІҢ CIS internet. CELTEPSIER D. 


ШАМЕН С bridge Cs, fH ei h5 51 ЕПС. host C's. UE # 


нша _695 





图 12.5 局 域 网 的 概 和 村 视图 


55i. Intemet 和 internet 

AU А ЯН internet "ҮҮӨ ғ k5 raw Internet Ж-Е 
度 用 ， 电 就 是 所 请 的 全 味 IP ЕФ, 

ЕНЕН А КЕНЕЕН ЛЕ ES EH — кезеген 咒 由 器 也 能 连接 高 速 点 淹 点 电话 
连接 ， 这 是 WAN (Wide-Area Network, ТЫҢ) 的 一 种 示例 ， 之 所 以 这 笃 叫 是 因为 它们 牟 荔 的 地 
理气 围 比 局 域 网 的 去 ,一般 而 言 。 路 由 器 可 以 用 率 由 各 种 局 域 网 和 广域网 构建 imera CEREA, 
Иш. Е126!Е Г -білете RA 3 Eg BERT —2 BACH. 


| ®а | +а |.| зи | |n || n|- | æn] 
T Le | LAN 


WAR L ' ауды ! 


图 12.6 一 个 小 型 的 Iniemet 【互联 网 络 ) 
L LT T OLEE ISI RE RE RE E 





meme (ПЫН) ЕХЕЕЕНЕН, lei Hed RUF AE PE GEM AM НН И 
ЖИ. ffr ЕКЕ КЕЕ ЕЛМЕНЕН, (Rim 9 E506 ЕНГІ ДҚ 
TESTI E Re E (c ИП И — B ug ddr aT ERE? 

Ws SHE — utr f В ЕКЕН LKU ЕНЕТЖЕНЕ2> ІШІНЕН, ipd 
HR MX. КИІНЕ d ЕШ (ТИНИ Т.Е ЖИ Е. 这 种 协 该 必需 提供 两 种 基本 
lE )): 

е тізі, GRIS od P BORED EL RU PEINE RR ЕКЕН. intenet 【百联 网 

m iiu k — f — im thc. ВЕ Т Зо OW. GENSET b 
个 这 种 internet B 3k (internet address), ЖН р Тт. 

e ИЕ. (БЕН Ls ЯНА ЫНЫ, OR] D FEES T EF ЖА RANAR 
ЖҮРДІ. internet CH ФЕ) Бал РАЕС Н ЛЕН НЕ Chunk) 
ЈА 6—70, АШИ ТШЕ, — TRUE HEEL X (header) R ЖЖ, 
Ë (payload) ІН, Ron LA Gon Kop tl ag E BUR НЕ ЕНІНЕН, Tro A ЕД 
JU ag d: UR НІНЕН. 

图 122 展示 了 一 个 主机 和 路 南 器 如 何 使 用 intemet CERAS) БУ ЕЖЕ МІНЕ 

ЖІГІТІҢ, K internet 百联 网 络 1 示例 由 两 个 局 堪 网 通过 一 各 点 由 器 连 污 看 成 ， РЕ 
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行 在 主机 A L. TE A 与 LAN1 相连 ， 它 发 送 了 一 串 数据 字 节 到 运行 在 主机 了 上 的 服务 器 端 ， 证 
机 B 则 连接 在 LAN2 .| 。 这 个 过 程 有 8 个 基本 步骤 : | 

І. fff BL А САЗ РАМТ МЕНЕН, MUS Ps BU E Uu На [BJP ЛЕ НАЛ 28 
іх. 

2. 主机 A Eme a REELT ЕТІН internet 【互联 网 络 ) ЫЗ ҺАМ, 808 7 — 
^* LANI ШШ» internet C 4 ВЕК) LL SERES] internet 【互联 网 络 ) 主机 B. LANI BUE Jd uc Ж 
出 器 。 然 后 它 传 送 此 帧 到 适 梧 器。 注意 ，LAN1 ШАА р -个 intemet〈 囊 上 联 网络) du. ЖЕ 
效 载荷 是 实际 的 用 户 数据 。 这 种 封 甘 是 基本 的 网 络 互联 方法 之 一 。 

З. LANI ЗЕЙНЕП Ы МІ. 

4. 当 此 桢 到 辽 路 由 器 时 ， 路 由 器 的 LAN1 适配器 从 电缆 上 读 取 它 ， 并 把 它 传 送 到 协议 软件 。 

5. 路 由 器 从 internet 包头 中 提取 出 目的 internet 地 吉 ， 并 省 它 作为 路 由 表 的 索引 ,确定 加 哪里 转 
ARTE, ERAH ELAN? AHAN IHH LANI 的 帧 状 ， 加 上 寻 址 到 主机 B BETIS LAN? ЇЙ 
头 ， 并 把 得 到 的 帧 忧 关 到 适配器 。 

6. ВЕ НАТАМ XE SR ДТ ER LL. 

7. "АҢ АЗЕ ВЕ, ЕЛЕЕ ESI, JU B SIm ЕСЕ. 

8. 最 后 ,三 机 B 上 的 协议 软件 剥 落 包 头 和 帧 尖 。 当 服务 器 进行 一 个 读 取 这 些 数 据 的 系统 调 册 时 ， 
吵 议 软件 最 终 将 得 到 的 数据 拷贝 到 服务 器 的 虚拟 地 址 空间 。 








FILA ET 
ЖР | ЕТ | 
(oL ЖЕ | | Gu 
— RN | | 
- x (Г ТРЕЕ 
MM 4 | | 
| АМ? 
га; d 
| Router 
= а: 1 x те š КУГО; 
LANI Lan 2 lanai o ANJ 
= | “ЖЕ MIFA (9 





| — | 
图 12.” 在 internet (互联 网 络 ) 上 ， 数 据 是 如 何 从 一 台 主 机 传送 刘 另 一 台 主 机 的 
AB PH: intemet Ch МІ) dm. ЕНІ: LANI (ih. ЕН2: LAN? fbh L. 
MN. ARRIEN ГУЕ MU EE. SU ROS [НП И Н ЛШ K BE SACR ТАБА 


J? 路 由 器 如 何 知道 入 哪里 转发 帧 呢 ? 当 网 络 拓扑 变化 时 ， 如 何 通知 路 由 器 ? UR ABERTA 
会 如 何 呢 ?虽然 如 此 ， 我 们 的 示例 抓 住 了 internet (互联 网 络 ) 思想 的 精髓 ， 封 装 是 关键 。 
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12.3 全 球 IP 因特网 

全 球 IP 因特网 是 internet 互联 网 阁 ) 最 著名 和 最 成 功 的 实现 。 从 1969 年 起 ， кашк 
РАВА СТЕ T. ШЕННЕ HSE Sta i И ЗЕТ ELSE E. HUE ПД 区 世纪 80 年 代 早 期 以 
k, Pg - No ae dg c — N e xps. Hl 128 lis T — [ЖИ 32 PI НЫН 
ПИН РЕА ЖЕЕ pou n, 









кле ата қамт 
| xem menn | 
| 
Kipikitu «X... | 


Wi ED сй ац. | 


ВЕ 128 一 个 因特网 应 用 程序 的 硬件 和 软件 组 纠 

He ARA EPLET N ТСРЛР (Transmission Control Protocol/Internet Protocol, Е 
SIL EM AR ig ім, Л.Ж АРИ КИЛИ ЗЕ НРА er. DP al I ЕНЕН 
ЖЕСІН Ho @ CRI Unix VO ЖЮ ЖА CRI 124 p HE REED, 
TRECE P HR ДЕЛ Ж ЖЩ ЖН]. ШЕЖЕ АЕ, ЖИЛ EM A FE MO; 
ТСРЛР ЕЖ. 

ТСРЛР 实际 是 一 个 协 该 族 ， 其 中 每 一 个 邦 提 供 和 不同 的 功能 。 例 如 ， IP ИЙНЕК ЖЕ i 
НІНЕН, ibo ШШЕ А РЕН ЕНЕНЕ КЖ. {ШШ ЗЕ 8 (datagram). 
IP ЖЫ СРР К ЕЛГЕ ЖТЖ, DN. n EN EMEN ЕКЕШ ЕИ. ТОЖЕ И, 
UDP СИГ КНН) METET IP НИХ, Rk, Ei 8T ELTESERS [8] S ЗЕ d LIS fi 
ТСР E- TERE 号 之 上 的 复杂 协议 ， 提 供 了 进程 闻 可 从 的 全 戏 工 【双向 的 ? ЕН. ATERN 
Hifi. RIH TCP ВЕ ТЕНЬ. ПЕ ЕКИ ЕН ИЕТ. ВЕНЕ TCP 和 
IP МЕҢНЕ ЕТ) tat ЖИЕ. АПИ ЖЕНЕ UDP, 

从 程序 员 的 角度 ， 我 们 可 以 把 因特网 看 做 一 个 世界 范围 的 主机 上 集 音 ， 庄 是 以 下 畦 性 

* EHE DERUM у — 32 (8 IP ERE, 

е ТР hcm ЕЗЕН | Internet domain name? 的 标识 。 

a MN ЕЕН ЖЫШ —4-44# (connection) AVE Hb Bde ng 主机 上 的 进程 

n. 
F `ah ААА ЖИ ЖИЕН I C 
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12.3.1 ІРІНІШ. 
Тр ДЫЙ З {у АЙЧ EGER. died IP 地 址 存放 在 如 图 129 所 水 的 IP ЖАМ 
Mm. 


а ————M———— - 





netmet/in.h 
/* internet address structure *, 
struct in асі + 

unsig^ed int s addr; ,* network byte order ibig endian) */ 


1; 





“-------- petine inh 


E129 由 地 让 结构 


ж: ААН ШАТЛЫ ІР 地 址 ? 
把 一 个 标量 地 址 存放 在 结构 中 , 是 赛 接 字 接 口 早 期 实现 的 不 幸 产 物 . X IPIE EE X7 PR E 
型 该 更 有 烛 义 ， 但 是 现在 更 改 已 经 太 壕 了 ， 因 为 已 经 有 大 量 应 用 是 基于 此 的 。 


LA ETE ES ЕЙ п БН ЯМЕ] Н EILE ЛЕ, ТСРЛР AE SE WS M X Y Rud? 
排序 (network byte order? СА Е SR Bo. don IP iE ERAR, К. A. P 地 址 好 
Br Ar НУНА НЕ AmA BER EVER ERE). BTE + UT DIT (һом byte order? Xi 
mik. Unix ИТ КАНН СҮРМЕ ІЛЕ Т. 全顺 序 加 实现 转换 ; 


"include «леі зле. Іп. р> 


unsigned long int htonlíunsigae3 long int hostlong!; 
unsigned shoit ict htons(unatgned short int hastshort!; 


жш: 按照 网 络 字 节 顺序 的 值 。 
unsigred long int nrohliansigned iong int rnetlonq:'; 
| unsigred sheri int arohsiunsigeod short int netshort!:; 


gu. AR T ju Y B PF06545. 

hotnl A AOE 32 Ar SEHE EUER IEEE А loss z I. ntohl ЖОН 32 r МАЧ 
ТИЙИН ЕН Т BU PO htons 和 ntohs KRO БД ЕЕ UTHR EERI PER 

IP 地 址 是 以 各 分 十 进 制 表示 法 表示 ， 这 里 ， EAE МИШ ЕШ iuba ДН! B UA 
F Wa] 2r JF. PJAT, 128.2.194.242 3X ДЕН 0x8002c2f2 的 占 分 十进制 走 未 。 在 Linux 系统 上 ， 你 能 
HIE HOSTNAME 命令 米 没 宣称 自己 主机 的 点 分 十 进 制 地址; 

linux» hostname -i 

т2н. 2.194.249 

PH Jd FTT fi HT inet. aton 和 inet. сай E 32:3. ТР Be Bb RO h ЕЕ e ape.: 


Ніпсілшіс «arpa/inet.h- 





int ineL atozícozst char “аср, struct іп addr *inp; 


Шақ: 苦 成 功 则 为 1， 若 出 错 则 为 0， 


char *1net ntoaístruct in addi іл); 





m. 486) T kw) Pj. 
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inet, alor FA BEBE ЗАРЫ (ср) ИЖ — p S ORE AR IP ШІН Сар). ІШІН, 
inel. nina. Hf CHE T 8 TERI P EREA ER А 2 FHEA., HER. 34 inet шоп 
[ШАН fep ЖЕЕ ЕИ EHEE, ms inet, moa ИТЕН HB ЖЕ ЖО. 
Au. nloa 和 aton Ir d € B? 
“Атынан (network), "a" Атай (application ), 8 “ы” НА. 


ЕЗІ 12.1 
ЖТЖ: 


9-ши 











ЕСІТТІ 









Пи Г ЇЇ 








l 205.188.145, 2) | 

ЕЛ 122 | | 

ТІНЕ һех2ай.с. EHEH РУШЫ ЕНЕ а ЧЕ НТ, Шш 

unix» „/һех2й@ Üx80ü2c2r2 

128,2,184,242 

ЕЗІН 123 

编写 程序 thexe， 它 将 它 的 点 身 Title Erbe oh GEB HH eb E. pa 

unix» ,/dd2hex 128.2.194.242 

üx8002c2£2 
12.32 因特网 域名 

因特网 客户 端 和 服务 器 互相 通信 时 使 用 的 是 IP Hu, Mi SET AOI EE. AER EREE 
的 ， 所 以 因特网 也 定 让 了 一 组 更 加 人 福 化 的 感 者 (domain name), Б-Н ЕРЕН [P Hh fr) 
Жл. NUR зе ІЛЕГЕ А] СЕН, ЖЕНЕ Ө), 例如 

xittyhawk,cmcl.cs.cmu.edu 
域 儿 集训 形成 了 一 个 屋 次 站 构 ， ЕМЕШ T Tix tee. d Т ЕЧ 
理解 这 点 ,图 12.10 Ж ТШ ERM. КЕННЕТ ИН. ГІН АМ. 
Ke ЖИШПН ЕБ 745. ҮА E (subdomain), 导 交 结构 中 的 第 一 层 是 一 沾 来 全 名 的 根 
BA. Е i  — RE E (firs-level domain names ), H {FREIS ICANN Intemet Corporation 
for Assigned Names and Numbers, ИЛЕ РР) dX. RUNE — ti ФА com. 
edu. gov. org #l met. 

FERRE (second-level) EE, BID cm edu， 这 些 域名 是 由 ICANN 的 将 个 授权 代理 
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按照 先 到 先 服务 的 基础 分 配 的 。 -日 一 个 组 织 得 到 了 一 个 第 二 层 域名 ， 那 么 它 就 可 以 在 这 个 子 域 中 
创建 任何 新 的 域名 了 。 








тәнен 

HERA 
Z N 第 EM% 

сти  bérkeley amazon 
N RENE 

cs ece WWW 

208 .216.181.15 
em pal 
kittyhawk imenal 


128.2.194.242 — 128 2 189.40 


图 1210 ”因特网 域名 层次 结构 的 一 部 分 
因特网 定义 了 域名 集合 和 人 地 址 集合 之 间 的 映射 。 直 到 1988 年 ， 这 个 映射 都 是 通过 一 个 叫做 
HOSTS.TXT 的 文本 文件 来 手工 维护 的 。 从 于 以 后 ， 这 个 映射 是 和 通过 分 布 世界 范围 内 的 数据 库 一 a 
为 DNS (域名 系统 ) 一 一 来 维护 的 。 从 概念 二 而 言 ，DNS 数据 库 由 上 百 万 的 图 12.11 所 示 的 主机 条 月 
Ж) Chost entry structure) 组 成 的 ， 其 中 每 条 定义 了 一 组 域名 〔〈 -个 官方 名 宇和 一 组 别名 和 CHIP 
地 址 之 问 的 上 映射。 从 数学 意义 上 讲 ， 你 可 以 认为 ， 每 条 主机 条 日 就 是 -个 域名 和 下 地 址 的 等 价 炎 ， 





netdb.h 
/* DNS host entry structure */ 
struct hostent Í 
char *h name; /* official domain name of host */ 
char **h aliases; ^* null-terminated array of domain names */ 
int h addrtvpe; /* host address type (АҒ. ІМЕТ) */ 
int h length; /* length of an address, in bytes */ 


char **h абӣг list;  /* null-terminated array of іп addr structs */ 





netab. 


图 1211 DNS 主机 条 目 些 构 


因特网 应 用 程序 通过 凋 用 gethostbyname 和 gethostbyaddr 8%, А DNS 数据 库 中 检索 任意 的 证 
机 条 日 。 







Жілсішіе «netdb.hs 






Struct hostent *gethostbyname(const char *name); 
Жы; 若 成 功 则 为 非 NULL 指针 ， 若 出 错 则 为 МІЛІ, 指针 ， 同 时 设置 h_ermo， 


struct hostent *gethostbyaddrí(const char *addr, int len, 0}; 


iE]: 震 成 功 则 为 非 NULL， 车 出 错 则 为 NULL 指针 ， 同 时 设置 h ermo. 
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gethostbyname 图 数 返回 和 域名 name 相关 的 主机 条 日 。gethostbyaddr 函数 返回 和 ІР 地 址 addr 
相关 的 主机 条 日 第 二 个 参数 给 出 了 一 个 下 地 址 的 字 节 长 度 , 对 于 里 前 的 因特网 而 言 总 是 四 个 字 节 。 
对 于 我 们 的 要 求 来 说 ， 第 二 个 参数 总 是 零 ， 

我 们 可 以 借助 于 图 12.12 中 的 HOSTINFO EF. KERE DNS 映射 的 特性 ， 这 个 程序 从 命 
令 行 读 取 一 个 域名 或 扣 分 | 进 制 地 址 ， 并 最 孙 相 应 的 主机 条 日。 


code/netp/hostinfo. c 


1 4include "сзарр.һ' 

2 

3 int main(irt arge, char **argv) 

4 { 

5 char %%рр; 

6 struct `n_addr айдат; 

7 struct hostent *hostp; 

8 

9 itf іагас !- 2) 1 

1C fprintf(stderr, "usage: $s «domain name or dotted-decimal» n", 
11 argvi[t] i: 

12 exit(0): 

13 } 

14 

15 if (inet atoníargv[l], &addr) != 0} 

16 hostp = Gethostbyaddrií(const char *)&addr, sizeof(addr), AF ІМЕТ): 
17 else 

18 hostp = Gethostbyname(argví-]): 

15 

2t printf('official hostname: $s'in", hostp-»h name); 
21 

22 for {рр = hostp-»h aliases; *pp !- NULL; рр++) 

23 printfi"alias: $s\n", *рр); 

24 

25 for (рр = Lostp-»h addr list; *pp != NULL; pp++) 1 
26 addr.s addr = *{{ипвїдпеа int *)*pp); 

27 printfí"'address: €sin", inet ntoataddr)); 

28 ) 

29 exit(0): 

30 } 


code/netp/hostinfo.c 


81212 检索 并 打印 DNS Ж ДЕН 


每 全 因特网 主机 部 有 本 地 定义 的 域名 tocalhost， 这 个 域名 总 是 映射 为 本 地 回 送 地 址 【loopback 
address) 127.0.0.1: 


unix» ./hostinfo localhost 
official hostname: localhost 
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alias: localhost.localdomain 
address: 127,0,0,1 


localhost 24527 51 922 17 ЕН APLE LEA] РЫ АНЯ Г АЕНА Ж {Н R Ж), 
这 对 调试 相当 有 用。 我 们 可 以 使 用 HOSTNAME 来 确定 我 们 本 地 主机 的 实际 域名 ， 

unix- ,/hostname 

kittyhawk,cmcl.cs,cmu,edu 


在 最 简单 的 情况 中 ，-- 个 域名 各 :个 IP 地 址 之 间 是 -一 映射 : 


unix> ./hostinfo kittyhawk.comci.cs.cmu.edu 
official hostname: kittyhawk.cmci.cs.cmu.edu 
address: 128.2.194,242 


Ж, (Aula F, £A S DSL RI T IP 地 址 ; 


unix» ./hostinfo ^s.mit.edu 
official hostname: EECS.MIT.EDU 
alias: z8.nit.edu 

address: l|8.62,.1.5 


在 最 遂 常 的 情况 F, £n Dm SIE ТРНЫН, 


unix» ./hostinfo www.aol.com 

official hostname: aol.com 

alias: www.aol.com 

address: 205,188,:60.121 

address: R4.12,143.13 

address: 205.188,146,23 

ж/а, Wie ЗАННИ РН SIR] IP Hh: 

ип1х> ,/hostintío zdu 

GeLhostbyname error: Mo address associated with name 
unix» ./hostinfo ozmcl.cs.cma.edu 


Gethostbyname error: No address associated with name 


旁 注 ， 有 多 少 因特网 主机 ? 

.因特网 软件 协会 (Internet Software Consortium, www.isc.ore) A4 1987 年 以 后 ， 每 年 进行 两 
次 因 特 沿 域名 调查 ,这 个 调查 , 通过 计算 已 经 分 配给 一 个 域名 的 IP 地 址 的 数量 来 估算 因特网 主机 的 
数量 ， 上 展示 了 一 种 邻 人 吃惊 的 趋势 ， 自 从 1987 年 以 来 ， 当 时 一 共 大 约 有 20 0046Ж, 4 
Tix ЖЕФ 8. 22001 年 6 月 ， 全 球 已 经 有 超过 120 000 000 台 因 特 网 主机 了 ， 


练习 是 12.4 

Ж 12.12 中 的 HOSTINFO 程序 ， 然 后 在 你 的 系统 上 过 续 远 行 hostinfao.aolcom EX. 
A. 在 三 个 主机 条 目的 外地 址 顺序 中 ， 你 注意 到 了 什么 ? 

B. APNEA A ERT 
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1233 ”因特网 连接 

因特网 客户 端 和 服务 器 通过 在 连接 (connection) 上 发 送 和 接收 字 节 流 来 通信 。 从 连接 一 对 进程 
mE X Emu. EHE x (point-to-point) 的 。 从 数据 可 以 同时 双向 流动 的 角度 来 说 ， 它 是 全 
ЯТ. Cfull-duplex) #7. 并且 从 一 一 除了 一 些 如 粗心 的 耕 钢 机 操作 员 切 断 了 电线 引起 灾难 性 的 失败 以 
外 一 一 由 源 进 程 发 出 的 字 节 流 最 终 被 日 的 进程 以 它 发 出 的 顺序 收 到 它 的 角度 来 说 ， 它 也 是 可 靠 的 。 

ERF (socket》 是 连接 的 端点 (end-point)。 每 个 套 接 字 前 有 相应 的 套 接 字 地 址 ， 是 由 一 个 因 
特 网 地 址 和 个 16 位 的 整数 端口 组 成 的 , 用 “地 址 : 端口 ”来 表示 。 当 客户 端 发 起 一 个 连接 请 求 轩 ， 
窜 书 端 氢 接 字 地 址 中 的 问世 是 由 内 核 自 动 分 配 鸭 ， 称 为 虱 时 端口 《epheineral port), ЖІП, ### 2% 
套 接 字 地 址 中 的 端口 通常 是 某 个 知名 的 端口 ， 是 和 服务 对 应 的 。 例 如, Web 服务 器 通 癌 使 用 山口 80, 
而 电子 邮件 服务 器 恒 用 端口 25. (E Unix 机 器 上 ， 文 件 jetejservices 色 含 一 张 这 台 机 器 提供 的 服务 以 
及 它们 的 知名 端口 号 的 综合 列表 。 

一 个 连接 是 由 它 两 端的 洋 接 字 地 址 惟一 确定 的 。 这 对 套 接 字 地 址 叫做 套 接 字 对 (socket pair), 
出 下 列 三 元 组 来 表示 的 ; 

(cliaddr:clipart, servaddr:servport) 


其 中 cliaddr EA wAY IP НЕШ. cliport E% F! ВЈ ET. servaddr 是 服务 器 的 下 地 址 ,而 servport 
是 服务 器 的 端口 。 便 如 ,图 12.13 展示 了 一 个 Web 客户 端 和 一 个 Web BB 382 BTE E, 在 这 个 示 
HE, Web 客户 端的 套 接 字 地 址 是 


128.2.194.2421:51213 


Ж}! ETT Ha B: ЗЕН 
128 2.194.242:51213 208.216.181.15.80 






qp moare cori iaa Gd gan тілігін ішкі ыч 了 -----immr --- enam clon 
n 


连接 套 接 字 对 
{128.2.194.242:51213, 208.216.1811580) | —— |; 
m rm PUR 服务 器 主机 地 址 
128.2.194.242 208.216.181 15 


图 12.13 因特网 连接 的 分 析 


其 中 端口 号 $1213 是 内 核 分 配 的 临时 端口 号 。Web 服务 器 的 套 接 字 地 址 是 ; 

204.216.181,15:80 

其 中 端口 号 80 是 和 Web ИЛЕШ НП S: AEREA PSRUB A SERRI Ж 
户 端 和 服务 器 之 间 的 连接 就 由 上 列 套 接 字 对 惟一 确定 了 ， 

(128,2.194,242:;51213, 1208.21656.181.15:80) 
旁 注 ， 因 特 网 的 起 源 

因特网 是 政府 、 学 校 和 工业 疏 合 作 的 最 成功 的 示例 之 一 ， 它 成 功 的 因素 很 多 ， 但 是 我 们 认为 有 
两 点 尤其 重要 : Ұлан 30 年 持续 不 变 的 投资 ， 以 及 充满 激 榜 的 研究 人 员 对 麻 澳 理工 大 学 的 Dave 
Chrke 提出 的 “粗略 一 致 和 能 用 的 代码 ”的 投入 。 | 

ДАЯР А 1957 EET S, АҢ, ЕЯРАНЯМ, ЖЕУ Sputnik, Я-ЖАЯ» 
ЖЕЖ, ERTER HAHA, ЖДАТЬ Ж (ARPA) ЖЕЛИ Л ЖЕК 


L 
k 
г 
г 
“< 
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在 科学 与 技术 上 的 频 导 地 位 ，1967 Ж, ARPA 的 Lawrence Roberts 提出 了 一 个 计划 ， 建 立 一 个 叫做 
ARPANET 的 新 网 络 ， 第 一 个 ARPANET 节点 是 在 1969 年 建立 并 运行 的 ， 到 1971 年 ， 有 了 13 个 
ARPANET 节点 ， 而 县 emai 作为 第 一 个 重要 的 网 络 应 用 淆 现 出 来 

1972 ^F, Robert Kahn 概括 了 网 结 互 联 的 一 般 原则 : 一 组 下 相连 接 的 网 络 ， 通 过 时 佑 “路 由 器 ” 
的 黑人 沼 于 按照 “尽力 情 送 基础 ”在 互相 独立 处 理 的 网 络 间 实现 通 愤 ，1974 F, Kahn 和 Vinton Cerf 
Ж Ж.Т TCPAP 协议 的 第 一 本 详细 资料 ， 到 1982 年 它 成 为 了 ARPANET 的 标准 网 络 互联 协议 ，1983 
年 1 月 1 和 日，ARPANET 的 春 个 节 志 都 切 撞 到 TCP/IP， 标 志 着 全 球 IP ЮЖ ИНИ. 

1985 年 , Paul Mockapetris 发 明了 DNS: 有 1000 多 台 因特网 主机 ,次 年 ,国家 科学 基金 会 (NSF ) 
用 56Kb/s pis КЕТ 13 个 节点 , ЖИЕТ МЕМЕТ 的 骨干 网 , 其 后 在 1988 年 升级 到 1.5Mb/s ТІ 
КАЗА, 91-4 45Mb/s ТЗ ЫАЖ, | 1988 年 ， 有 越过 50000 台 主 机 ，1989 +. AH 
的 ARPANET 正式 退休 了 , 1995 +, 已 经 有 几乎 10 000 000 台 因 特 网 主机 了 , NSF 取消 了 NSENET, 
并 且 几 基于 由 一 打 在 洛 的 公众 网 络 接 入 直达 抬 的 私有 高 业 肖 干 网 的 现代 因特网 架构 取代 了 它 ， 
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ЖЧ 0 (socket interface) 是 一 组 用 来 结合 Unix VO рО КИ КУ РАН. KERR 
Ж БАЗЕ, SEU Unix $P., Windows 和 Macintosh ҰЙ, [8 12.14 给 出 了 一 个 典型 的 
Ж-Н 99689) E FXTNERTED.5R84D1 63 T АЖЫ, (aT DL GE FSK E x А 
Ie 8. 

2 1 50 服 各 器 








преп lisrenfgd 


oper clienttd 








=] rio readlineb 


等 竺 来 白 下 个 
Er ЕПН Ж 


1214 “ЕТЕП 


mut. ЖИРЕП 
赛 捷 宇 接口 是 加 州 伯 克利 分 校 的 研究 人 员 在 20 世纪 80 年 代 早期 提出 的 ， 因 为 这 个 原因 ， 它 也 
经 常 被 叫做 伯克利 委 接 字 。 伯 壳 利 的 研究 书 使 得 套 按 宇 接口 适用 手 任何 底层 的 协议 ， 第 -个 实现 的 
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就 是 基于 TCP/IP 协议 的 ， 他们 把 它 包 括 在 Unix 42 BSD ($^ d €, ЖЕРАКИЕЗЕЖФЖЕЖ, 
这 在 因特网 的 历史 上 是 一 个 重大 事件 。 几 娃 一 诊 之 间 ， 成 千 上 万 的 人 们 接 卸 到 了 TCP/IP ЖЕН 
码 ， 它 引起 了 巨大 的 兴趣 ， 并 汶 发 了 曾 的 网 络 和 网 阁 互 联 研 究 的 浪潮 . 


12.4.1 Ж 

从 Unix AL EAR OUS, ВНЕСЕНА ИОН (end-point)。 从 Unix НЕКЕ, ЖЖ 
子 就 是 -个 有 相应 描述 符 的 把 开 文 件 。 

因特网 的 套 接 字 地 址 存 训 在 如 图 12.15 所 示 的 类 型 为 sockaddr in 的 16 FHAR. HTAR 

网 应 用 ，sin_family 成 员 是 АЕ INTE; sin port 成 员 是 一 个 16 位 的 端口 号 ， 而 sin_addr 成 员 职 是 一 

Л“ 32 BEES IP ҢҢ. IP 地 址 和 端口 导 总 是 以 网 络 字 节 顾 序 《大 端 法 存放 的 。 

-一 一 一人 OCR socketbits.h (included by socket. h). sockaddr in: netinivin.h 
/^* Generic socket address structure (for connect, bind, and accept) */ 
struct ѕоскайсг 1 

unsigned short sa, family; /* protocol family */ 
char sa data[14]; /% address data. */ 
}; 


z* lnternet-style socket address structure */ 
struct sockaddr іл í 
unsigned short sin family; /* address family (always AF ІМЕТ) */ 


unsigned short sin port; /* port number in network byte ordex */ 
struct in_addr sin, addr; /* IP address in network byte order */ 
unsigned char sin, zero[8]; /* pad to sizeofístruct sockaddr) */ 


sockaddr: soacketbits.h (included by socket.h). sockaddr in: netinit/in.h 


81215 Ж ЕТИШЕ 
im addr ЫЛЫ 12.9 Br. 


gui: іл ЕЖЕН 2? 
An АЖ ЕЮ (internet) 的 编写 ， 而 不 是 输入 《mpat) ШЕ, 


connect, bind Ж. accept 阔 煞 昌 求 一 个 指向 与 协议 相关 的 套 接 字 地 址 结构 的 指针 。 癌 接 字 接口 的 
区 计 者 自 临 的 问题 是 ， 如 何 定义 这 些 函 数 ， 使 之 能 接受 各 种 类 型 的 套 接 字 地 址 结构 。 今天， 我 们 可 
以 使 用 通用 的 void* 指 针 ， 那 时 在 C 中 并 不 存在 这 种 类 型 的 指针 。 解 决 办 法 是 定义 套 接 字 冰 数 要 求 
个 指 间 遂 用 sockaddr 结构 的 指针 ， 然 后 要 求 应 用 程序 将 与 协议 特定 的 结构 的 指针 强制 转 剖 成 这 个 
衣 有 几 绪 构 。 为 了 简化 我 们 的 代码 示例 ， 我 们 跟随 Steven 的 指导 ， 定 叉 下 面 的 类 型 ， 
typedef struct sockaddr SA; 


然后 无 论 何 时 我 们 需要 将 sockaddr_in 结构 强制 转换 成 通用 sockaddr 结构 时 ， 我 们 都 竺 用 这 个 
类型 【参见 图 12.16 的 第 20 行 的 示例 )。 


12.4.2 socket 函数 
ЖТҚ SEE H] socket 函数 来 创建 -AAF MEA (socket descriptor). 
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Kinclude «sys/types.h» 
Жіпсінде «sys/socket.h- 


int socketíint domain, int type, int prot2co.); 


іш. жалт ард БАМ, uu 5-1, 





在 我 们 的 代码 中 ， 我 们 总 是 带 这 样 的 参数 来 调用 socket e E 

clien-:fd-Socket(AF INET, SOCE STREAM, Ü): 

ЖІП, АР ІМЕТ 去 明 我 们 止 在 使 用 因特网 ， 而 5ОСК STREAM dc ERE R BIS PLE HOS 
点 《end-point)。socket 返回 的 clientfd 描述 符 仅 是 部 分 打开 ， 并 且 不 能 用 于 读 写 ,我 们 如 何 完成 打 
开盘 接 字 的 十 作 ， 版 决 于 我 们 是 客户 端 还 是 服务 器 。 下 一 他 描述 当 我 们 是 客户 端 时 如 何 完成 打开 套 
RZE 工作。 
12.4.3 connect 函数 

客户 端 是 通过 调用 connect MRR зг ЖИ ЖИЕ. 


Hinclude «sys/socket.h» 


int connect(int sockfd, struct sockaddr *serv addr, int aédrlen |; 
| 返回 : 车 戌 功 则 为 D0， 着 出 错 则 为 -1， 
connect KR AA УЕ ТАНЕ 0) ѕегу адаг 的 服务 器 建立 一 个 因特网 连接 ， 其 中 addrlen 是 
stzeof(sockaddr in). connect 函数 会 阳 填 ， 一 直到 连接 成 功 建 立 或 是 发 生 错 误 ， 如 果 成 功 ，sockfd F 
ЖЕТЕТІНІ, ARA. SSmi Rit ego 
(x:y, serv addr.sin addr:serv, addr.sin port) 
AE], KP x 6 PH IP HE, TU y 表示 临时 端口 ， 它 惟一 地 确定 了 客户 端 主机 上 的 客 产 站 
进程 。 
12.44 open clientfd 函数 
ЖГ) RL socket 和 connect Ж 88.80 3 7 AH open clientfd 的 辅助 函数 是 很 方便 的 ， 客 户 
sm n] АЛТ ЖАЙ Ae УЖЕ, 


finclude "csapp.h' 





int open clientfdi(char *hostname, int port); 


退回 ; л! АА. + Unix 出 错 则 为 -1， 若 DNS 出 错 则 为 -2， 





open, cliendd ARAR 2p 38 && У Ye Bt. 该 服务 器 运行 在 主机 hostname. 上 ,并 在 知名 端口 port 
ТАЛ ИП k. CRUA -个 打开 的 在 接 字 描 述 符 ， 该 描述 符 准 备 寻 了， 可 以 用 Unix UO Ж 
入 和 输出 。 图 12,16 给 出 了 open clientfd 的 代码 。 





code/sre/esapp.c 
1 int open ciientfdicanar *hostname, int port) 
2 i 
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E int clientfd; 

4 struct hostent “ір; 

5 struct sockaddr, in serveraddr; 

5 

? if [((clientfd = socket (AF_INET, SOCK STREAM, 01) < 0) 
В return -1; /*check еппо for cause of error */ 

9 

10 {* Fill in the server s IP address and port */ 

11 itf ((hpb = gethos;byname(hostname)] == NULL) 

12 return -2: /*check h ermo for cause of error */ 

13 bzero[í(char %) &serveraddr, sizeof(serveraddr);:; 

14 Serveraddr.sin family = AF INET; 

15 bcopy (ichar *)hp--h, addr, 

16 [char *)&serveraddr.sin addr.s addr, hp--h, length); 
17 Serveraddr.sin port = btons {port}; 

18 

18 /* Establish а connection with the server */ 

20 if (connecticlientfd, (SA %) &serveraddr, sizeof(serveraddr)] < 0] 
21 return -1; 

22 return clientfd; 

23 1 


一 —— codeisreicsapp.c 
1215 open clienttd: 和 服务 器 建立 连接 的 辅助 留 数 

EURI ERTKEY (第 7 行 ) E RARS Atk DNS 主机 条 上 日， 并 搁 贝 主机 条 目 中 的 
s 8 Ip 籽 拓 《已 经 是 按 桔 网 络 字 节 顺序 的 了 )， 到 服务 器 的 套 接 字 好 址 结构 《第 117-1617). 在 用 
按照 网 络 字 节 顺序 的 服务 器 的 知名 端 听 号 刺 始 化 套 接 字 地 址 结构 (第 17 行 ) 之 后 ， 我 们 发 起 了 一 个 
到 服务 器 的 连接 请 求 〈 第 20 行 )。 当 connect 函数 返回 时 ， 我 们 返回 套 搂 字 描述 符 给 客户 端 ， 客 户 
端 就 可 以 立即 开 始 用 Unix VO 和 服务 器 通信 了 e 
12.45 bind 函数 

ТОЈ C bind. listen 和 accept 被 服务 器 用 来 和 客户 端 建立 连接 。 


| include esys/sccket.h» 






int bindi(int sockfd, struct sockaddr *my addr, int acdrlen); 
1810). Xx Ab mo, ЖЕЖ 5-1, 
bind ERA Er VEDI my адаг 中 的 服务 器 总 接 字 邮 址 和 套 接 字 描 述 符 sockfd 联系 起 来 。 参 数 
addrlen 就 是 sizeof(sockaddr in). 
12.4.6 listen 函数 
ЖЕКЕЛЕ ЖЕ ЖЛЕ (k. 服务 器 是 等 待 来 自 客户 端的 连接 请 求 的 被 动 实 体 。 默 认 情 
BR. ЕТА socket 两 数 创建 的 描述 符 对 应 于 主动 套 接 字 (active socket)， 它 存在 于 一 个 连接 
的 客户 端 。 服 务 器 调用 jisten 函数 告诉 内 核 ， 描 述 符 是 被 服务 器 而 不 是 客户 端 使 用 的 。 
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"include «sys/socket.h- 


int listen([in.: sockfd, int backlog): 


ims PRANA О. FERA- 





listen 通 数 将 sockfd А T ЕЖЕ ЕЛЖАН (listening socket), AE Fa A 
接受 来 白 客 户 端 的 连接 请 求 。 backlog ЖЕНТ л: T AREI ias ВОК MARAR N h 3 
待 的 末 完 成 连接 请 求 的 数量 。baeklog SARRE AERE ТСРЛР 钞 议 的 理解， 这 超出 了 我 们 讨 
沦 的 范围 。 通 芝 我 们 会 把 心 没 置 为 一 个 较 太 的 值 ， 比 如 1024, 


12.4.7 open listenfd 函数 
我 们 发 现 将 socket. bind 和 listen E £l er ОЦА open. listenfd КН Ee 82 W R£ ЖЕДИ. 
ВЕ НИН ЖШ МАЛА. 


#inciude "снаор.Һ" 


int open listenfdíiint рогі}; 





Б. 车 成 功 则 为 描述 罕 ， 攻 Unix НА] 5-1. 


open listenfd Ж ЗТЯЯНАЫ “МАЛА, XX BUR HB ЕТИ ARTI роп LERE 
WR. ІҢ 12.17 В Í open listenfd 的 代码 。 在 我 们 创建 了 listenfd 套 接 字 描 述 符 之 后 ， 我 们 使用 
setsockopt 函数 【在 这 里 没有 描述 ) ЖАСЫЛЫ РЕНІШ. ОАЫ, — EB 
出 服务 器 将 在 大 约 30 P A i APP a и Ж, РНН Т Vii. 


code/src/esupp.e 


1 int open listenfdíint port) 
2 { 
3 int listenfd, optval-1; 
Д struct sockaddr in serveraddr: 
5 
6 /* Create a socket descriptor */ 
7 if {ilisterfd = socket(AF INET, SOCK STREAM, Ü)) < 0} 
8 return -1; 
9 
10 /* Eliminates "Address already in use" error from bind. */ 
11 if fsetsackoptíilistenfd, SOL SOCKET, SO REUSEADDR, 
12 (const void *)J&optval , sizeofíint)) < DO) 
13 return -1; 
14 
15 /* Listenfd will be an endpoint for all requests to port 
16 on апу IP address for this host */ 
7 bzerot (char *)]&serveraddr, sizeofí(serveraddr)); 
18 serveraddr.sin family = AF INET; 
19 serveraddr.sin addr.s addr = htonlíINADDR ANY]; 


20 serveraddr,sin роуЕ = htons((unsigned short)port); 
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21 if (bind(iistenfd, ISA *)&serveraddr, sizeof(serveraddr)) < 0) 
22 return -1; 

23 

24 /* Make it a listening socket ready to accept connection requests */ 

25 if (listenílistenfd, LISTENQ) < 0) 

26 return -1; 

2j return listenfd; 

AB | 


code/src/csapp.c 
图 12.17 open listenfd: fTTERUK[SI — TEREE "F STARTER BK 


HOT. Bg ТЕКЕ ЕНСЕ НАНЫ НЫ), ЭДЕН bind 函数 做 准备 。 在 这 个 例子 中 ， 我 们 
用 INADDR ANY 通配符 地 址 来 告诉 内 核 这 个 服务 器 将 接受 来 自 这 合 主机 的 任何 TP Sede CR 19 £0 
和 到 知名 端口 nor (2200) 的 请 求 。 注 意 ， 我 们 用 Мон! 和 htons РА TP ЕНІН АСЕМ, 
字 节 顺序 转换 为 阅 络 字 节 顺序 。 最 后 ， 我 们 将 listenfd 转换 为 一 个 监听 描述 符 【 第 25 行 )， 并 将 它 
返回 给 调用 者 ， 


12.4.8 accept 函数 
服务 器 通过 调用 accept К ЖЕНЕР ДЕЛЕ ИЖ: 


finciude zs8ys/socket.h- 


int accept(int listenfd, struct sockaddr *addr, int *addrlen); 


Ар ЖАМЫЛА, ЖЕН. 





accept Ж PESE ELS ЖЕНЕН K AA Ur ЖАР Hstenfd, 然后 在 addr PAS Ж PUE 
接 子 地址， 并 返回 一 个 已 连 接 描 述 禁 〈ceonnected descriptor), ХАЙ n ЕҢ ЖАН Unix VO ва 
Jr ide Prisa fee 

NU STER Co BH EZ Taf Pen fif] e yp EXER. ЛА TIER Pm Hei 
Kh “Эл. WAH, СВИНЕ IX, ЗЕТЕ РАА ЕКЕ E dE АИИ. DERRAT ЕЁ Р 
和 服务 器 之 间 已 经 建立 起 来 了 的 连接 的 一 个 端点 。 服 务 器 每 次 楼 受 连 接 诸 求 村 ， 都 会 创建 一 次 ， 只 
存在 十 服务 占 为 一 个 客户 端 服务 的 过 程 中 。 

图 12.18 ffe T SU GF RS DLE REOR TERR. EA - 步 中 ， 服 务 器 调用 acep, Tire 
ПАНК, RAER НБ З. PE- 下， 描述 符 0-2 预 留 给 了 标准 文件 。 

TESR rn, PUSH connect ЖӨЖ, BE ХЕ ЖІ listenfd。 第 三 步 ，aecept EGIT 
HI -个 新 的 已 连接 描述 符 connfd (我 们 假设 是 描述 符 4)， 在 clientfd 和 connfd 之 间 建 六 连接 ， 并 
НАН connfd 给 应 用 程序 。 客 户 问 也 从 connect 返回 ， 在 这 一 点 以 后 ， 客 户 端 和 服务 器 就 分 别 
可 以 通过 读 和 号 clientfd 和 connfd 3E[p 6283828 Т. 


Sii: Н ТН DEBES BEER 
ЖО REIR IB A EXPE eT п S. 3 tia Бена, E-A, 34 A 23: 3 
HIRE, Же, ККАЛ ЖЕНА mié. ЕУЕФИЯЛПЯТЫАЯНЭЯЖАЯЕ, CEU 
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肘 处 理 许 多 客户 瑞 连 接 ， 例 如 ， 每 次 一 依 连 接 请 求 到 达 监 听 描 述 荐 时 ， 我 们 可 以 派生 《tk) 一 个 
新 的 进程 , 它 通 过 它 的 已 连接 描述 符 与 客户 端 通 迟 , 必 将 在 第 13 章 中 学 习 更 多 关于 并 发 服务 器 的 内 
*. 


ligtenfd(í31) 


. ° 1. 服务 器 阻塞 在 accept, КЕНЕЛЕ 
EP 述 符 listenfd 上 的 连接 请 求 。 


clientfd 


4444N-LLi.-- L LL ic-i----------- --- = -Id- 一 -=---------- ----------- 一 ---- --- --- ----------- ---- 一 -- 


| 2. E P BË PHNH НИЕ ЗЕ: connect, 
din Т в | 创建 连接 请 求 ， 


liatenfdi3) 
Д 3. ВЗЯЛА accent 返回 conníd. Ж 
和 客户 端 БЖ connect 返回 .现在 在 rlientfi 
和 connfd 之 间 已 经 建 半 起 了 连接 。 


clientfd conn£d (4) 
图 12.18 监听 描述 符 和 已 连接 描述 符 的 角色 


12.49 echo 客户 端 和 服务 髓 的 示例 

学 习 套 接 宁 接 趾 的 域 好 方法 是 研究 示例 本 人 码 。 图 12.19 展示 太一 个 echo RA RERI. AEA 
ЖЕМІНЕ, 客户 山 进入 一 个 箱 环 ， 反 复 从 标准 输入 读 取 文本 行 ， 发 送 文本 行 给 服务 器 ， 
从 服务 器 起 取 啊 应 行 ， 并 输出 结果 到 标准 输出 ， 当 fgets ЕТИ А MEF) EOF 时 ， 或 着 因为 用 
РОН ЕВА ctrl-d, 或 者 因为 在 一 个 重 定向 的 输入 文件 中 用 尽 了 所 有 的 文本 行 时 , 循环 就 终止 。 

逢 环 终 让 之 后 ， 客 户 端 关 闭 描述 符 。 这 会 导 第 发 送 一 个 EOF 遂 敌 到 服务 器 ， 当 服务 器 从 它 的 
rio readlineb 滑 数 收 审 一 个 为 零 的 返回 码 时 ， 就 会 检测 到 这 个 结果 。 在 关闭 它 的 描述 符 后 ， 瞪 户 端 
中 终止 了 。 届 然 客户 上 端 内 核 在 一 个 进程 终止 时 会 白 动 关闭 所 有 打开 的 描述 答 ， 第 24 行 的 close 就 没 
有 必要 了 ,不 过 ， 显 式 地 关闭 我 们 已 经 打开 的 任何 描述 符 是 一 个 良好 的 编程 半 惯 。 


code/netpiechoclient.c 
1 "include "csapp.h" 
2 
3 int main(int argc, char **arqv) 
4 { 
5 int clientfd, port; 
6 char *host, bu£[MAXLINE]; 
7 rio t rio; 
Н 
9 if (агас != 3) í 
10 tprintf(sLderr, "usage: $s «host» <рогї>\п", argv|0]); 
11 exit(0): 
12 } 
13 host = argv[i]; 
14 port = atolíargv[2]); 
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15 

16 clientfd = Open clientfd(host, port); 

17 Rio readinitbí(&rio, clientfd); 

18 

19 while (Fgets (buf, MAXLINE, stdin) ‘= NULL) í 
20 Rio writeniclientfà, buf, strlenibuf]l); 
21 Rio readlinebí&rio, buf, MAXLINE); 

22 Fputsimpuf, stdout); 

23 } 

24 -lose(clienttà); 

25 exiti0); 

26 } 


code/netp/echoclient. с 


Ж 1219 echo Pul fe 


图 1220 Es f echo 服务 器 的 卡 程序 。 在 打开 蚂 听 描述 符 后 ， 它 进入 -AEREA BOTA 
孝 等 符 - -个 来 自 客 户 端的 过 接 请 求 ， 输 出 已 连接 客户 端的 域名 和 IP 地址 ， 并 调用 echo 函数 为 这 些 
A Fr. dE echo 程序 迟 回 后 ， 主 程序 关 团 已 连接 描述 符 。 一旦 客户 强 种 服务 器 关 财 了 它们 各 目 
的 描述 人行， 连接 也 就 终止 了 。 


codefnetp/echoserveri.c 


1 #1пс шае "csapp.h" 

2 

3 void echoiint connfd): 

4 

5 ink main(int агас, char **argv) 

6 { 

7 int listenfd, сопліа, port, сііепііеп; 

B struct sockaddr in clientaddr; 

9 struct hostent *hp; 

10 cnar *haddrp; 

11 if {arge !- 2) 1 

12 Fprintftistderr, "usage: %8 «port»n', argv[0]!; 

13 exit (0); 

14 ) 

15 pert = atoií(argví1l); 

16 

17 listenfd = Open listenfdíport]; 

18 while (1) { 

19 clientlen = sizeofí(clientaddr); 

20 connfd = Acceptilistenfd, {5А *)jàclientaddr, &clientlen); 

21 

22 {® determine the domain name and ІР address of the client */ 

23 hp = Gethostboyaddr((const char *!&clientaddr.sin addr.s addr, 
24 sizeofí(clientaddr.sin addr.s айдаг}, АЕ INET); 
25 haddrp = inei, ntoa(clienteddr.sin acdr); 

26 brintfí("server connected to Es (ts)in", hp-»h name, haddrp): 


712 $123 


28 echoatconntd) ; 
29 Close(connfd); 
30 ] 

31 ехісій); 

3200) 


code/netp/echoserveri.c 
1220 it echo 服务 路 的 主 程序 
注意 ,我 们 的 简单 的 echo 服务 器 一 次 只 能 处 理 一 个 客户 端 。 这 种 类 型 的 服务 器 一 次 一 个 地 在 窜 
РАНЫ, ЖАҚҚА 2-5 (iterative server)。 在 第 13 章 中 ， 我 们 将 学 习 如 何 建 立 现 加 复杂 的 并 
发 服务 器 《concurrent server)， 它 能 够 同时 处 百名 个 客户 端 。 


AEn. 8 12.21 展 小 了 echo EFRR. АЕБ Я УУ ЖА), ННІ rio_readiineb 基数 在 第 
10 ТИЕ EOF. 


M т н -——— code/netp/echo. С 
1 finclude "csapp. h" 
2 
3 void echoiint connfd) 
4 { 
5 сізше і n; 
6 char buf [MAXLINE]; 
' rio t rio; 
d 
9 Rio readinitb(&rio, connfd); 
10 whileiiín = Rio readlinebi&rio, buf, HAXLINE]]) !- 0) [ 
11 printfí("server received $d bytesin", n); 
12 Rio writen(connfd, buf, n); 
13 ) 
14 | 


epde/netp/echo.c 
图 1221 Wii (fh echo 函数 


mu. 在 连接 中 EOF 意味 件 么 ? 

EOF 的 概念 常常 使 学 生 们 感到 迷 感 ， 尤 其 是 在 因特网 连接 的 上 下 文中 ， 首 先 ， 我 们 需要 理解 其 
KARAR EOF 字符 这 样 的 一 个 东西 。 进 一 步 来 说 ，BDF 是 由 内 核 检 测 到 的 一 各 条件 。 应 用 程序 
在 它 接 收 到 一 个 由 read Ақын жанан, CHAAR EOF 条 件 ， 对 于 磁盘 文件 ， 当 前 文 
THREAUSXSPERW. EX EOF。 对 平 因 特 网 连接 ， 当 一 个 进程 美 团 连 接 在 它 的 那 一 端 时 ， 会 
发 生 БОР, 连接 另 一 端的 进程 在 试图 读 取 流 中 最 后 一 个 字 节 之 后 ， 会 检测 到 EOF, 
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Е, 我 们 已 经 讨论 了 一 个 简单 的 echo 服务 器 上 下 文中 的 网 络 编程。 在 这 一 节 时 ,我 们 将 
同 你 展 小 如 何 利 用 网 络 编程 的 基本 概念 ， 来 创建 你 自己 的 虽然 小 但 是 功能 齐全 的 Web 服务 器 。 
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12.5.1 Web 基础 

Web ЕЛШЛІН ЕСЕНИН AE c AEST ЖЖ f HSA, nit HTTP (Hypertext 
Transfer Protocol， 超 文本 传输 协议 )。HTTP 是 -个 简单 的 协议 。 — Web ЖАҢ OW EX S0 
打开 一 个 到 服务 器 的 因特网 连接 ， 并 用 请 求 某 些 内 容 。 服 务 器 啊 应 所 请 求 的 内 容 ， 然 后 天 闭 连 接 。 
Т а ТЕН А, ДЕЕ ТАЕ Б. 

Web BE ЖЖ ЛАН ЖЖ АЕ 3 СЙ FTP) А ВА? ЕН Web 内 容 可 以 用 ~ 
种 叫做 HTML (Hypertext Markup Language, 超 文 本 标记 语言 ) 的 语言 来 编写。 一 个 HTML EFR) 
BARS Oif. 它们 若 诉 浏览 器 如 何 显 玉 这 页 中 的 各 种 文本 和 图 形 对 象 。 例 如 ， 代 得 


«Б» Make me bold! <zD>5 


肖 诉 浏览 器 有 几 粗 体 字 类 型 输出 <b> 和 <b> 标 记 之 间 的 文本 ,然而 ，HTML 真 IE 的 强大 之 处 在 于 一 个 
АШЫГАН ОШ), 这 些 指 针 可 以 指 问 存放 在 性 何 因 特 网 主机 上 的 内 容 。 ИШ. 一 个 格式 
如 下 的 HTML 行 


<a href2"http://www.cmu.edu/index.html"»Carnegie Ме11оп</а> 
告诉 浏览 器 高 亮 显示 文本 对 象 “Camegie Mellon”， 并 且 创 建 一 个 超 链接 ， 它 指 同 存 区 在 СМО Web 
IRA 11И index.htm) 的 HTML 文件 ， 如 果 用 户 单 击 了 这 个 高 亮 文 本 对 每， 浏览 器 从 СМО 服务 
器 中 请 求 相 应 的 HTML 文件 ， 并 显示 它 。 


£i. ШИЕ 

万 维 网 是 Tim Berners-Lee 创建 和 的 ， 地 是 一 位 在 瑞 黄 物理 实验 室 CERN (ОНЫ ФИЯ) 
工作 的 软件 工程 师 。1989 年 ，Bemers-Lee 号 了 一 个 内 部 备忘录 ， 提 出 了 一 个 分 布 式 超 文 本 系统 ， 它 
能 连接 “用 链 组 成 的 笔记 的 网 (web of notes with links), AELA AAH A HEH CERN 的 科 
学 家 共享 和 管理 信息 . 在 接 下 来 的 两 年 多 里 ，Bemers-lee 实现 了 第 一 个 Web 服务 器 和 Web 浏览 器 
之 后 ， 在 CERN 内 部 以 及 其 他 一 些 网 站 中 ，Web 发 展 出 了 小 规模 的 拥护 者 。1993 年 一 个 关键 事件 发 
ЖТ. Marc Andreesen ( 后 来 创建 了 Netscape) 和 他 在 NCSA 的 同事 发 布 了 一 种 图 形 化 的 浏览 器 ， 
串 散 MGSAIC， 可 以 为 三 种 主要 的 平台 所 司 用 : Unix. Windows 和 Macintosh. 4& MOSAIC RA G, 
对 Web 的 兴趣 爆发 了 ，Web 网 站 以 乔 年 ОАА ЕМЕ. 到 2002 年 , 已 经 有 超过 36 000 000 
小 世界 范围 的 Web 网 站 了 (Ж B vwww.netcraftcom 的 Netcraft Web 38 # ). 


12.5.12 Web 内 容 
МТ Web € Pm mS. AREA MIME (Multipurpose Internet Mail Extensions, 
多 用 途 的 网 际 邮件 扩充 协议 ) 类 型 相关 的 字 节 序列 。 图 12.22 展示 了 一 些 常用 的 MIME 2820, 


text. html HTML 9i ІҢ 
texte plain AL AX K 


application/postscript PSx tá 
image/gif GIF 格 式 编码 的 一 讲 制 图 你 
image/jpeg JPEG f& x AR ODE ВИ 


图 12.22 MME 类 型 示例 
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Web НАР AN B] АРАН pe PEN Ж: 

° H FAR EE, БИТЕР ОЕША Р. 磁盘 文件 称 为 静态 内 容 (static content), 
而 返回 文件 给 客户 端的 过 程 称 为 服务 静态 内 容 Cserving static content). 

. 运行 -个 可 执行 文件 ， 并 将 它 的 输出 返回 给 客户 端 。 运 行 时 可 执行 文件 产生 的 输出 称 为 动 
SAT (dynamic content)， 而 运行 程序 并 退回 它 的 输出 到 客户 端的 过 程 称 为 服务 动态 内 容 
(serving dynamic content >, 

每 条 由 Web 服务 器 返回 的 内 容 都 是 和 它 管理 的 某 个 文件 相关 联 的 。 这 些 文 件 中 的 每 一 个 都 有 - 

МЕ — 6. M URL (Universal Resource Locator， 通 用 资源 定位 符 )， 人 和 例如，URL 
http://www.aàol.com:80/index.html 

表示 因特网 主机 ww w.aol.com 上 一 个 称 为 index.html [f] HTML 文件 , 它 是 由 一 个 监听 80 端口 的 Web 

服务 器 管理 的 。 端 口号 是 可 选 的 ， 而 知名 的 HTTP 默认 的 端口 就 是 89。 囊 执行 文件 的 URL 可 以 在 

误 件 名 后 包括 程序 参数 。"?” 字 符 分 隔 文件 名 和 套数 ， 而 日 每 个 参数 都 用 “六 ”字符 分 陋 开 。 例 如 ， 

URL 


http://kittyhawk.cmcl.cs.cmu.edu:8000/cgi-bin/adder?215900&213 
标识 了 一 个 叫做 jegi-binfaddr 的 可 执行 文件 ,会 带 两 个 参数 字符 串 15000 81213 来 调用 它 。 在 事务 过 
程 中 ， 客 广 端 和 服务 器 使 用 的 是 URL 的 不 同 部 分 。 秽 如 ， 客 户 端 使 用 前 如 


http://www.aol.com:80 


ЖЕНЕ, ДЕИН, ШЫЖЕ ЕТ ЕП ЕУ RE €. 9 8 ЕН 5186 
/index.htmi 
ЖАКЕТ АЯТИ tE, JPSRIEGSGKI EST. ЖАЛА. 
关于 服务 器 如 何 解释 一 个 URL 89528, G— 5X ERA. 
e 确定 一 个 URL 指 网 的 是 静态 内 容 还 是 动态 内 容 没 有 标准 的 规则 。 每 个 服务 器 对 它 气 管理 的 
文件 都 有 日 己 的 规则 。 一 种 常见 的 方法 是 ， 确 认 -组 日 录 ， 例 如 egi-bin， 所 有 的 可 执行 性 
X PE BED UE TOROS Н m 
e л % РЕН ЛГ “/” 不 表示 Unix 的 根 日 录 。 相反 ， 它 表示 的 是 被 请 求 内 容 类 型 的 主 
日 录 。 例 如， 可以 将 一 个 服务 器 配置 成 这 样 ， 所 有 的 静态 内 容 存 放 在 目录 /sfrhttpdyhtml F, 
而 所 有 的 动态 内 容 都 存放 在 日 某 fusrihttpsicgi-bin F. 
e RDR URL RAE “1” 学 符 ， 所 有 服务 器 将 其 扩展 为 某 个 默认 的 主页 ， 例 如 jindex.html。 
这 解释 了 为 御 么 简单 地 在 浏览 器 中 键入 -个 域名 就 可 以 取出 一 个 网 站 的 主页 。 浏 览 占 在 
URL 后 添加 缺失 的 “/*， 关 将 之 忧 递 给 服务 器 ， 服 务 器 又 把 UT 扩展 到 某 个 默认 的 文件 
%. 


125.3 HTTP 事务 

因为 HTTP 是 基于 在 因特网 连接 上 传送 的 文本 行 的 ， 我 们 可 以 使 用 Unix 的 TELNET 程序 来 和 
任何 因特网 上 的 Web 服务 器 执行 事务 。 对 于 调试 齐 连 接 上 通过 文本 行 来 与 客户 端 对 话 的 服务 器 来 
B. TELNET 种 序 是 非常 便利 的 。 别 如 ， 图 12.23 使 用 TELNET 向 AOL Web 服务 器 请 求 主页 ， 
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1 ип1х> telnet www.aol.com 80 Ciient: open connection to server 
z Trying 205.188.145,23... Telnet prints 3 lines to the terminal 
4 Connected to aol.com. 

4 Escape character is 7717. 

5 GET / ҢТТЕ/1.1 Client: request line 

Ё host: www.aol.com Client: required HTTP/1.1 header 

T Client: empty line terminates headers. 
8 HTTP/1.0 200 OK Server: response line 

9 MIME-Version: 1,0 Server: followed by five response headers 
10 Date: Mon, 08 Jan 2001 04:59:42 GMT 

11 Server: NaviServer/2.0 AOLserver/2.3.3 


12 Content-Type: text/html Server: expect HTML in the response body 


13  Content-Length: 42092 Server; expect 42,092 bytes in the response body 
14 Server: empty line terminates response headers 
15 «html» Server: first HTML line іп response body 

15 Das Server: 765 lines of HTML not shown. 

17  «/html» Server: last HTML iine in response hody 

18 Connection closed by foreign host, Server: closes connection 

19  unix- Client: closes connection and terminates 


1223 一 个 服务 静态 内 容 的 НПР 事务 


在 第 一 行 ,我 们 从 Unix shell 运行 TELNET, 要 求 它 打开 一 个 到 ADL Web 服务 器 的 连接 .TELNET 
阿 终 疗 打 印 三 行 得 出 ， 打 开 和 连接 ， 然 后 等 竺 我 们 输入 文本 (第 5 行 )。 每 次 我 们 输入 一 个 文本 行 ， 并 
EAER. TELNET 会 读 取 该 行 ， 存 后 面 加 上 加 车 和 换行 符号 《在 C 的 表示 中 为 “wan”)， 并 且 
将 这 一 行 发 送 到 服务 器 。 这 是 和 HTTP 标准 相符 的 ，HTTP 标准 缆 求 每 个 文本 行 都 由 一 个 回 车 和 换 
ПАРЕ. ГЕЯ, 我 们 输入 一 :个 HTTP 请 求 (第 5~7 行 )。 服务 器 返回 HTTP SZ (第 
8 一 17 行 )， 然 后 关闭 连接 (第 18 行 )。 

HTTP 请 求 

— HTTP 请 来 的 给 成 是 这 样 的 ， 一 个 请 求 行 【request line) {第 5 行 )， 后 面 跟随 零 个 或 更 多 
ARRA (request header) (第 6 行 )， 肖 跟随 一 个 字 的 交 本 行 来 终止 报头 列表 (第 了 行 )。-- 个 请 
求 行 的 形式 是 

xzmethod»«uris«version- 


HTIP 支持 许多 不 同 的 方法 , 包括 GET. POST, OPTIONS. HEAD. PUT, DELETE 和 TRACE。 
我 们 将 只 讨论 广 为 应 用 的 GET 方法， 根据 某 研究 调查 ， 它 占 了 99% HTTP iñ [79], GET 方法 指 
导 服 务 器 生成 和 返回 URI (Uniform Resource ldentifier， 统 一 资源 标识 符 】 标识 的 内 容 。URI 是 相应 
的 URL 的 后 缘 ， 包 括 文 忻 名 和 可 选 的 参数 。* 

请 求 行 中 的 <version> 字 段 表 明了 该 请 求 遵循 的 HTTP 版 本 ;最 新 的 HTTP 版 本 是 HTTP/1.1[271。 
HTTP/1.0 是 从 1996 年 沿用 至 邻 的 老 版 本 。HTTP7L.I 定义 了 一 些 附 术 的 报 买 ， 为 诸如 缓冲 和 安全 等 
向 级 特性 提供 文 持 ， 它 还 支持 一 种 机 制 ， 允 许 客户 端 和 服务 器 在 同一 条 持久 连接 【persistent 


2 每 际 上， 具有 当 浏览 器 请 求 肉 窜 时 ， 才 会 这 样 。 如 果 代 理 服务 器 请 求 内 容 ， 那 么 UR! 必须 是 完整 的 URL. 
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connection) 上 执行 条 个 事务 。 在 实际 中 ， 两 个 版 本 是 互相 兼容 的 ， 因 为 HTTP/L0 Pe РЗ АДЕ 
器 会 简单 地 忽略 HTTP/1.1 的 报头 。 

总 地 玉 说 ， 第 5 行 的 请 求 行 蜡 求 服务 器 肥 出 并 返回 HTML 文件 jindex.htmt。 它 也 告知 服务 器 请 
求 剩 下 的 部 分 是 HTTP/1.1 85533. 

请 求 报头 为 服务 器 提供 了 额外 的 停电 ， 例 如 浏览 器 的 商标 名 ， 或 者 浏览 器 理解 站 MIME ЖОЙ, 
请 求 圾 头 的 格式 为 

zheader names: «header datas 

针对 我 们 的 日 的 , 惟一 需要 关注 的 报 涉 是 Host 报头 CR 6 170. 这 个 报头 在 HTTP/L I 请 求 中 是 
需要 的 ， 而 在 HTTP/10 请 求 中 是 不 需要 的 。 代 理 缓 存 〈froxy cache) 会 使 用 Host 报头 ， 这 个 代理 
缓 仔 有 时 作为 浏览 器 和 管理 被 请 求 文 件 的 原始 服务 器 【origin server). 的 中 介 。 客 户 端 和 原始 服务 器 
之 间 ， 可 以 有 多 个 代理 ， 即 所 谓 的 代理 尾 〈proxy chain), Host 报头 中 的 数据 ， 指 示 了 上 原始 服务 器 的 
域名 ， 使 得 代理 链 中 的 代理 能 够 判断 它 是 否 可 以 搬 有 一 个 梳 请 求 内 容 的 本 址 缓存 的 副本 。 

ERE 12.23 中 的 示例 ， 第 7 行 的 空 交 本 行 (通过 在 我 们 的 键盘 上 键入 回 车 键 生 成 的 ) Ж 
小 了 报头 ， 并 指示 服务 器 发 送 被 请 求 的 HTML 文件 。 

HTTP W pf 

HTTP 啊 应 和 HTTP 请 求 是 相似 的 ,一 :个 НТТР 啊 应 的 组 成 是 这 样 的 ， 个 响应 行 (response line) 
(第 8 行 }， 后 面 跟 筷 着 零 个 域 更 多 的 响应 报头 (response header) (第 9 一 13 行 )， 再 跟随 一 个 终 政 报 
KUTE СЖ 1417), ВОН FL ЕЖ (response body) (第 15—17 47). — ER TTA А 

<version> «status code» «status message» 

M der BERG e mL PRESE] НТТР 版 本 ，status code 【状态 码 ) О-У ab iF Эй. Ha 


对 请 求 的 处 理 。status message ОЧА ҢА) 黎 出 与 错误 代码 等 价 的 英文 描述 。 图 1224 列 出 了 一 些 
币 见 的 状态 玛 ， 以 及 它们 相 诬 的 消息 。 












处 理 请 求 无 误 
РЕЛЕ АННЫ ЕНЕ 
НЕЗ Sk НЕР ТА Ж 

服务 器 七 权 访 问 所 请 求 的 文件 

昭 务 器 小 能 找到 所 请 求 的 文件 
ЖЕКЕН ЖЕЛІ 

服务 器 趟 去 持 请 求 的 版 本 





ЖА 
b Up 
aar 
AI 
未 实现 
HTTP МАЛ ЕЁ 








12.24 —IE НТТР RAE 


Ж 9—13 tr B mpeg ЗЕКЕТ ХЕ WES BH АМ. ЕТПЕЙ, ЮТ ЖЕНУ. Ж 
Content-Type. (Ж 12 17), ИА ЖИНА E (er N SS MME 类 型 ， 以 及 Content-Length (Ж 
13 行 )， 用 来 指 水 响应 主体 的 字 节 大 小 。 

第 14 行 的 终止 响应 报头 的 空 文本 行 ， 其 后 跟随 着 响应 主体 ， 啊 应 主体 中 包含 着 被 请 求 的 内 容 。 
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1254 ”服务 动态 内 容 

如 果 我 们 停 下 来 考虑 一 下 ， 个 服务 器 是 如 何 癌 客户 端 提 供 动态 内 容 的， 就 会 发 现 “ 些 问题 。 
例如 ， 客 户 端 如 何 将 程序 参数 传递 给 服务 器 ? 服务 器 如 何 将 这 些 参数 传递 给 它 所 创建 的 了 进程 ? 有 最 
务 器 如 何 将 子 进程 生成 内 容 所 请 要 的 其 他 信息 传递 给 ЕЯВ? 子 进程 将 它 的 输出 发 送 到 哪里 ? 一 个 
Му СОТ (Common Gateway jnterface， 遂 用 网 关 接 口 ) 的 实际 标准 的 出 现 解 诀 了 这 些 问 题 。 

客户 端 如 何 将 程序 参数 传递 给 服务 器 ? 

GET 请 求 的 参数 在 UR PE. 正如 我 们 看 到 的 ,，- -个 “3? ”字符 分 喇 了 文件 名 和 参数 ， 而 每 
个 参数 都 用 一 个 “ 朗 ” 字 符 分 隔 开 。 参 数 中 不 全 许 有 空格 ， 仙 必须 用 字符 串 “ 名 20” 来 表 水 。 对 其 
他 特殊 宇 符 ， 也 存在 着 相似 的 编 妈 ， 
ЖЕ: 在 НТТР POST 请 求 中 传递 参数 

HTTP POST 请 求 中 的 参数 是 在 请 求 主体 【Tequest body ) F @ E URI P Ri. 


m sre n or CP E PER 

在 服务 器 接收 一 个 如 下 的 请 求 后 

GET /cgi-bin/addser?15000£213 HTTP/1.1 

它 调用 fork 3E EJ EE — ATH. HAH execve ТЕ TERRE E F XP /egi-bin/adder EF. ($ 
adder НІМЕН, BERRA СО # Л. M Ili sy CGI КЕИШ). mH. AAE CGI H 
序 是 用 Perl МАНЫ, ВТЕ CGI FEP tB Ж ЕИ А CGA COGI. script), AWA execve 之 前 ， 
于 进程 将 CGI 环境 变量 QUERY_STRING GR “15000622137, adder 程序 在 运行 时 可 以 用 Unix 
gelenv 函数 来 引用 它 。 


服务 器 如 何 将 其 他 信息 传递 给 对 进程 ? 
CG 定义 了 大 量 的 其 他 环境 变量 ， -个 CGI 程序 在 它 运行 时 , [ША ЕЖЕ. 1225 
给 出 了 其 中 的 “部 分 。 





















QUERY STRING PUT 


SERVER PORT S We iur XLI 
REQUEST METHOD GETEKPOST 

КЕМОТЕ HOST | CAT P E 
REMOTE_ADDR 育 户 办 的 点 为 十 进 制 IP 地 趟 


CONTENT ТҮРЕ 
CONTENT LENGTH 





”只 对 POST 而 育 : 请 求 体 的 MIME 炎 型 
内 对 POST 出言， 请 求 体 的 字 节 大 小 
图 1225 CGI 环境 变量 示例 

ТКЕН АЗАН” 

- 个 CGI 程序 将 它 的 动态 内 容 发 送 到 标准 输出 。 在 子 进 程 加 载 并 运行 CGI 程序 之 前 ， 它 使 用 
Unix dup? 兵 数 将 标准 输出 重 定向 到 和 客户 端 相 关联 的 已 连接 描述 符 。 因此， 任何 CGI 程序 写 到 标 
Ж ШШ) ЖЕ Ар ИКЕ КЖ Р ИН. 

ЕЕ, ЗУМА Л DB XEFRUE ШИ N DQ ЯШ АТ, BUULOT3R Е Е 
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Content-type 和 Content-length MÆRK., ШИ ЖЖ E З 224. 


81226 展示 了 一 个 简单 的 CGI 程序， 它 对 两 个 参数 求 和 ,并 返回 带 结果 的 HTML 文件 给 客户 


Aj. A 12.27 展示 了 一 个 HTTP 事务 ， 它 从 adder 程序 提供 动态 内 容 。 





下 


code/neip/tiny/cgi-bin/adder.c 


finclude "csapp.h" 


int nainí(void) í 
char *buf, %р: 
char argl|MAXLINE), aàrg2[MAXKLINE], content[MAXLINE]; 
int п1=0, n2-L; 


/* Extract the two argurnents */ 


if ((buf = getenv("QUERY STRING")) (= NULL) 1 
р = strchribuf, '&']; 
*p 0; 


strcpy(argl, buf): 
strcpviarg2, p«1); 
nl = atoi;argdl!); 
na = atoi'arg2]; 


/* Make rhe response body */ 
sprintfí(content, "Welcome to add.com: "); 


sprinti (content, "*sTHE Internet addition portal.rin«p»", content]; 


sprintfí(content, "€sThe answer is: $d + $d = $dirineps', 
content, nl, nz, nl + n2): 
sprintfí(content, "ЖаТһапкв for visiting!Nr*n", content]; 


/* Generate the HTTP response */ 

printfí("Content-length: $&dirr", strl.en(content)); 
printfí("Content-Lype: text/htmlirMnirNn"); 
printfi"£€s", content); 

fflushistdout]; 

exit (D]; 


81226 ”对 两 个 整数 求 和 的 CG 程序 


unix» telnet kittyhawk.cmcl.cs.cmu.edu 8000 Client: open connection 
Tryirg 128.2.194.242.,., 
Connected to kittynawk.cmcl.cs.cmu.edu. 
Escape character is 7717. 
GET /cgi-bin/adder?15000&213 HTTP/1.0 Client; request line 

Client: empty line terminates headers 
HTTP/1.0 200 OK Server: response line 


code/netp/tiny/cgi-bin/adder.c 


网 络 编程 719 


2 Server: Tiny Мер Server Server; identify server 

9 Content-length: 115 Adder; expect 115 bytes in response body 
12 Content-type: text/html Adder: expect HTML in response body 
11 Adder: empty line terminates headers 


12 Welcome to add.com: THE Internet addition portal. Adder; first HTML line 

13 <р>Іһе answer is: 15000 + 213 = 15213 Adder: second HTML line in response body 
1i zp»Thanks for visiting! Adder: third HTML line in response body 

i5 Connection closed by ісгеісп host. Server: closes connection 

15 unix» Client: closes connection and terminates 


图 12.27 一 个 提供 动态 HTML 内 容 的 НТТР 事务 


ЖӨН; E HTTP POST 请 求 中 传递 参数 给 CGI 程序 
对 于 POST 请 求 ， 于 进 灶 也 需要 重 定向 标准 输入 到 已 连接 档 述 蔡 。CGI 程序 将 从 标准 输入 中 读 
Jf K 3 ЖЕУ 


95) 12.5 


É 119334 8, AT E ibi XT EM А-У B] P $ CHOR UO ds. Mm. Bj 12.26 中 
的 CG 程序 却 能 没有 任何 司 题 地 使 用 标准 IO， 为 什么 呢 ? 


12.6 综合 ，Tiny Web 服务 器 


我 们 通过 创建 -一 个 虽然 小 但 是 功能 齐全 的 称 为 Tiny 的 Web 服务 器 来 结 史 我 们 对 网 络 编程 的 讨 
i£. Tiny 是 一 个 有 趣 的 程序 。 在 短 短 250 行 代码 中 ， 它 结 侣 了 许多 我 们 已 经 学 习 到 的 思想 ， 例 如 进 
程控 制 、Unix IO. Т НТТР. 虽然 它 缺 乏 一 个 实际 服务 器 所 有 具 鱼 的 动能 性、 稳定 性 种 实 
全 性 , 但 是 它 足 角 用 来 为 实际 的 Web 浏览 器 提供 静态 和 动态 内 容 。 我们 鼓励 你 研究 它 。 并 所 自己 实 
现 它 。 将 一 个 实际 的 浏览 器 指 风 你 自己 的 服务 器 ,看 着 它 显示 - -个 复杂 的 带 有 文本 和 图 片 的 Web 页 
面 ， 真 是 非常 令 人 兴 音 【甚至 对 我 们 这 些 作者 来 说 ， 也 是 如 此 1)。 

Tiny 的 main Fë 

图 12.28 展示 了 Tiny 的 主 程序 ，Tiny E -个 迄 代 服务 器 ， 监 昕 在 命令 行 中 确定 移 端 UU 上 的 连接 
їз Ж. ТЕ ЕН open_listenfd KAHA - ЧАИ sU, Tny БЕЛДЕН ИЕН, 
反复 地 接受 -个 连接 请 求 ‘第 31 行 )}， 执 行事 务 《第 32 行 );， 并 关闭 连接 的 它 邦 一 端 (第 33 行 )， 


code/netp/tiny/tiny.c 





f * 
* tiny.c - A simple, iterative HTTP/1.0 Web server that uses the 


* GET method to serve static and dynamic content. 
к / 


kinccude "сзарр.һ" 


void doití(int fd); 
void read requesthdrsirio t *үр!; 
іле parse urií(char *uri, char *filename, char *cgiargs); 


Q0 ZO 2] DW п gm t MI L 
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ІП void serve staticí(int fd, char *fllename, int filesize); 
11 void get filetype(cnar *filename, char *filetype); 


12 void serve dynamicí(int fd, char *filename, char *cgiargs); 


13 моі clienterrorí(int Ға, char *cause, char *errnum, 


14 char *shortmsg, char *longmsqg);:; 
15 

16 int mainíint argc, char **argv! 

1? l 

18 int listenfd, conrfd, port, clientlen; 

13 struct sockaddr ir clientaddr; 

24 

21 ж Check command line args */ 

22 if (ағас 1- 2) d 

23 fprintf(stderr, "usage: $8 <pƏrt>xXn"00, argv[0]); 
24 exiti(1); 

AD I 

26 port = &toilargv[1]): 

27 

28 -istenfd = Open, listentd:iport); 

29 wnile [1] í 

30 clientlen = sizeoficlientaddür); 

31 connfd = Accept(listenfd, (SA *)&kcllentaddr, &clientlen]; 
32 doit {connfd): 

33 Closetconntd); 

34 ) 

35 } 


12,28 Tiny Web 服务 器 
doit Ж 


code/netp/tiny/tiny.c 


图 12.29 中 的 doit ERE AES. 个 HTTP 事务 ,首先 ， 我们 读 和 解析 请 求 行 (Ж 11-12 行 )。 注 


Ж, BIERA 117 中 的 rio readlineb 因数 眠 取 请 求 行 。 





code/netp/tiny/tiny.c 


l void doití(int fd) 

à { 

3 int is, static: 

4 strucL stat sbu-; 

n char buf[MAXLINE], method MAXLINE], uri[MAXLINE], vezsion[MAXLINE]; 
Б char filename[MAXLINE], cgiargs[MAXLINE]; 

7 "10.5 rio: 

d 

9 /* Read request Ime and headers */ 

10 Rio, readinitbí(&rio, Ға); 

11 Rio readlinebí&rio, buf, MAXLINE); 

12 sscanfí(bui, "%5 $s %5", method, uri, version); 
13 it (stLrcasecmpimethod, "GET")) { 


14 clienterrorifd, method, "501", “Кос Implemented", 
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15 "Tiny does not implement this method"; 
16 return; 
17 ] 
18 read redquesthüdrgsi&rio); 
19 
20 /* Parse URI from GET request */ 
21 is stat-c = parse uri(uri, filename, cgiargs;; 
22 її istatífilename, &sbuf] < 0) I 
23 clienterrorí(ftd, filename, "404", "Hot found", 
24 "Tiny couldn’ t ind this file"); 
25 returrn; 
26 } 
21 
28 1f (15 stavLic) { / Serve static content */ 
23 if :1(6 ISasEGisbuf.st mode)) || '(S IRUSR & sbuf,.st, mode]? { 
39 Cclienterror(fd, filename, "405", "Forbidden", 
31 "Tiny coulda’ t read the file"); 
i2 return; 
33 } 
34 serve staticí(fd, filenare, sbuf.st size); 
35 } 
36 else | /* Serve dynamic content */ 
37 itf (1(5 ISREG(sDbuf.st mode)]) |! r(S IXUSR & sbu?.st mode): 1 
38 clienterrorifc, filename, "i103", "Forbidden", 
39 "Tiny couldn t run the CGI program"); 
40 return; 
47 | 
2 serve dynamic(fd, filename, cgiargs); 
43 } 
44 | 





code/netp/tiny/tiny.c 
图 12.29 Tinydoit: 处 理 一 个 НТТР 事务 


Tiny Ax Kf GET 方法 。 如 果 客 户 端 请 求 其 他 方法 【比如 POST)， 我 们 发 送 给 它 一 个 错误 信息 ， 
并 返回 到 主 程序 【第 13 一 17 行 》， 主 程序 随后 关闭 连 护 并 等 德 下 一 个 连接 请 求 。 否则， 我 们 读 并 且 
( 像 我 们 将 要 看 到 的 那样 ;忽略 任何 请 求 报头 《第 18 行 )， 

然后 ， 我 们 将 UR 解析 为 一 个 交 件 名 和 一 个 可 能 为 字 的 CGI 参数 串 ， 并 且 我 们 设置 一 个 标志 ， 
表明 请 求 的 是 静态 内 容 还 是 动态 内 容 (第 21 行 )， 如 昌文 件 在 磁盘 上 不 存在 ， 我 们 立即 发 送 一 个 错 
误 信 息 给 客户 端 ， 并 返回 【第 22 一 26 ff) 

最 后 ， 恕 果 请 求 的 是 静 套 上 内容 ， 我 们 就 核实 该 文件 是 一 个 普通 文件 ， 而 我 们 是 有 读 权 限 的 【第 
29 行 )。 如 果 是 这 样 ， 我 们 就 向 客户 端 提供 静态 内 容 。 相 似 地 ， 如 果 请 求 的 是 动态 内 容 ， 我 们 就 核 
实 该 文件 是 可 执行 文件 (第 37 行 )， 如 果 是 这 样 ， 我 们 就 杰 续 ， 并 且 提供 动态 内 容 【 第 42 行 )。 

clienterror Ж 

Tiny 缺 之 一 个 实际 服务 器 的 许多 错误 处 理 特性 。 然 而 ， 它 会 检查 -- 些 明显 的 错误 ， 并 把 它们 报 
告 给 客户 端 。 图 12.30 中 的 clienterror 函数 发 送 — HTTP 响应 到 客户 端 , 在 响应 行 中 包含 相应 的 状 
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恋 码 和 状态 消息 ， 以 及 响应 主体 中 的 -个 HTML 文件 ， 向 浏览 器 的 用 户 解释 这 个 错误 。 


cade/neip/tiny/tiny.c 


l void clientcrrorí(int fd, char *cause, char *errnum, 

2 char *sLtortzsg, char *longmsg) 

3 1 

4 сһак buf[MAXLTNE], body [MAXBUF] ; 

5 

6 /* Build the HTTP response body */ 

) sprintf (body, "«htmle«title»Tiny Errzor«/title»s"]; 

8 aprintf(body, "*s<body bgcolors""fflfff""»irin", body}: 
9 sprinLf(body, "Жебе: $sXrin", body, errnum, shortmsg): 
10 sprintfí(body, "€*s«p»*s: €s*rin", body, longmsg, cause); 
11 sprintfí(body, "€$s«hr»«em»The Tiny Web server«c/em»'rMn", body); 
12 

13 /* Print the HTTP response */ 

14 sprintf(buf, "HITP/1.0 &s $sirin", errnum, shortmnsq): 
L5 Rig writenítfd, buf, strlen(butl!; 

16 Sprint£íbu£, "Content-type: text/htmiskr*in"]; 

17 Hio writenitd, buf, strlen(hbuf)); 

18 sprintt (buf, "Content-length: &*dirWinsrin", stzlen(body] i: 
13 Rio writeníifd, buf, strleníbu£]); 

20 Rio мгісеп (Ға, body, вігІеп(Ьоау) }; 

2l 1 


cade/mnetp/tiny/tiny.c 
图 12.30 Tiny clienterror: [SE PA Az 3x — 7b C SEU a 
HX- F, HTML Уау ЯН H EATA ЖЕН K 2839. ТАШ, ВЕРЕ HTML. 内 容 为 
—T*3 FR CR 7-101 10. АН :来 我 们 可 以 简单 地 确定 它 的 大 小 《第 1827). 还 有 ， 请 注意 我 们 
ALBUS Eds e ER ИЕН 11.3 中 健壮 的 rio writen А. 
read requesthdrs M% 
Tiny 不 司 用 请 来 报 关中 的 任何 信息 . МИУА АА 12.31 中 的 read. requesthárs AAK 320 
кын. 注意, 终止 请 求 报头 的 室 广 本 行 是 由 回 车 和 换行 符 对 组 成 的 ,我们 在 第 6 行 中 检查 它 ， 


code/netp/tinyl/tinvy.c 





1 void read requesthdrs(rio t *rp) 

2 | 

3 char Dui |MAXLINE!; 

4 

5 Rio, readlineb(rp, buf, MAXLINE); 

5 whileiístrempibuf, "Мг\п"}! 

7 Rio reaclinebí(rp, buf, MAKLINE); 
8 rerurn; 

3 1] 





code/netp/tiny/tiny.c 
12.31 Tinyread requesthars: 读 取 并 忽略 请 求 报头 


网 络 编程 


parse uri Ж 
Tiny ЕРІНЕ Hook ЖЕКЕН Пәк, ПО АИТ УЖЕШ + HR А /cgi-bin, CARRE 
FT cgi-bin 的 URI 都 会 被 认为 表示 的 是 对 动态 内 容 的 请 求 。 默 认 的 文件 名 是 .由 ome.htm。 
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图 12.32 中 的 parse, uri 函数 实现 了 这 些 策略 。 它 将 URI 解析 为 一 个 文件 各 和 一 个 可 选 的 CGI 


参数 从。 如 果 请 求 的 是 静态 内 容 (第 5 行 )， 我 们 将 清除 CGI 参数 串 (第 656 行 )， 然 后 将 URL 转换 为 
一 个 相对 的 Unix 路 径 名 ， 例 如 ,indexhtml (第 7 一 8 行 }。 如 果 URI 是 用 “/” 结 尾 的 CR 9470. 我 
们 将 把 默认 的 文 忻 名 如 在 后 面 :第 10 行 )。 男 一 方面 如果 请 求 的 是 动态 内 容 (第 13 (Ds. 我们 三 
会 抽取 出 所 有 的 СОТ 参数 (第 1420 £00, 并 将 URI 剩 下 的 部 分 转换 为 一 个 相对 的 Unix 文件 名 (第 


21--22 59, 
1 int parse uri;char “ігі, char *filename, char *cgiargs) 
2 { 
3 char *ptr: 
4 
5 if ['!strstr(uri, "cgi-bin")] . /*Static content */ 
Б strcopyicgiargs, ""}; 
7 strcpy(filename, "."); 
B strcatí(filename, uri); 
9 if (uri[strlen(uri)-1] == ' 
10 strcat(Ffilerame, "home.html"); 
11 return 1; 
12 ] 
13 else { /* Dynamic content */ 
14 ptr = index{uri, '?'): 
15 if (ptr) Í 
16 strcpylcgiargs, Dtr+1); 
17 *ptr = 450%; 
18 ) 
18 else 
20 Strcopyícgiargs, ""}; 
21 strepyí(filename, ","!; 
22 strcatí(filename, uri); 
23 return 0; 
24 } 
25 } 





图 12.32 Tiny porse_u 让 解析 一 个 НТТР URI 


serve static FR SK 


Tiny 提供 四 种 不 同类 型 的 静态 内 容 : HTML 文件 、 无 格式 的 文本 文 付 ， 以 及 编码 为 GIF 和 JPG 


格 陈 的 图片 。 这 些 文件 区 型 占据 Web 上 提供 的 络 大 部 分 静态 内 容 。 
图 12.33 中 的 serve static KRUS- A HTTP 响应 ， 其 主体 包含 个 本 地 文件 的 内 容 。 首 先 ， 


code/netp/tiny/tiny.c 


code/netp/tiny/tiny.c 
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codemetp/tiny/tiny.e 
1 vold serve statici(int fd, char *filename, int filesize) 
2 { 
3 int srcíd; 
à char *srcp, filetype[MAXL-NE], buf[MAXBUF]: 
了 
Б /* Send response headers to client */ 
7 get fi:etype(filename, flletype); 
Б sprint (buf, "HTTP/1,0 200 Оқыту"); 
g sprinL£(bu£, "$s5erver: Tiny Web ServerXrMn", buf}; 
10 Sprintfibuf, "$SsContent-length: %ах\т\п", but, Ffilesizë); 
11 sSprintfí(buf, "&sContent-Lype: €sir*nirsn^, buf, filetype): 
12 Rio writentfd, buf, strlení(buf?)); 
13 
14 /* Send response body to client */ 
15 үсіп = Openífilename, О роу, 0}; 
15 srep = Маар(0, filesize, 2ROT READ, MAP PRIVA^E, srcfd, 0); 
17 Closeisretd): 
18 Rio writenifd, агср, fiiesizel: 
19 Munmap(srcp, filesize); 
2 | 
21 
22 /* 
23 * get filetype - derive file type from file name 
2А “/ 
25 void get filetype(char *filename, char *filetype) 
26 [ 
27 i£ (s:rstr(filoname, ".html")) 
28 stropy(filetype, "text/html"); 
29 cise jf istrstríifilename, " .cif")} 
30 stropy filetype. "aíimage/gif"):; 
31 else ІЁ Istrstr(filename, ",.Jpq")) 
32 strepy filetype, "image/jpeg": 
23 else 
3d sLrcpvifiletvpe. "rext/plain"); 
35 } 


code/netp/tiny/tiny.c 

图 12.33 Tiny serve static: 为 客户 端 提 供 静 态 内 容 
接着 ， 我 们 将 被 请 求 谈 件 的 为 容 拷 页 到 己 连 接 指 述 符 fd. ЖАЛЫНЫ ЕЖ ОЖ 15--19 £10. XX 
日 的 代码 是 比较 微 如 的 ， 寄 要 仔细 研究 。 第 15 行为 读 打 开 了 名 ename， 并 获得 了 它 的 描述 符 。 在 第 
16 fT, Unix mmap 抽 数 将 被 请 求 交 件 映射 到 -个 虚拟 存 本 器 空间 。 回想 我 们 在 第 10.8 节 中 对 mmap 


ШИИ, WH ттар 将 交 件 secfd 的 前 filesize 个 字 节 映射 到 -- 个 从 地 起 srep 开始 的 私有 只 读 虚 氢 存 
fH ese hk. 
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-Н ТИНЕ ЕНТ, RD EE ИКЕ T. REEL Y (第 17 4D. 
ТАЛ ЕКЕН МИНЕ HERREN. B 18 行 执行 的 是 到 客户 器 的 实 隐 文件 伟 
IÆ. по writen ЖЕЛІМ seep 位 置 开 始 的 filesize TE T£ C4 125 £8 Т Br bs sk nia tE) 
到 客户 端的 已 连接 描述 符 。 最 后 ， 第 19 行 释放 了 映射 的 虚拟 存储 器 区 域 。 这 对 于 避免 -一 个 潜在 的 致 
ШАНИН ЖӘН E E 

serve dynamic ЯК 

Tiny 通过 派生 一 个 子 进 称 并 在 子 进程 的 上 下 文中 运行 一 个 CGI 程序 , 来 提供 各 种 类 型 的 动态 内 
Tre 

ІҢ 12.34 中 的 serve, dynamic РЁ — JE 4G ТА И AG ТЕ EDITT OB 677 17), 
同时 还 包 插 带 有 信息 的 Server Wk CR 8-9 fT). CO 程序 负责 发 送 响应 的 剩余 部 分 。 注 意 ， 这 并 
不 像 我 们 可 能 希望 的 那样 健 阁 ， 因 为 它 没 有 考虑 到 CGI ЖЕТЕН САН ЖЕНЕ o RETE 


code/netp/tiny/tinv.c 


1 void serve dynamicí(íint fd, char *fiiename, char *cglargz] 

2 { 

E char bufI[IMAXLINE], *emptylisti] = [ NULL ); 

4 

5 /* Return first part of HTTP response */ 

6 sprintfíbuf, "HTTP/1.0 200 ОК\г\п"); 

7 Rio writenifd, bui, strleníbuf)); 

8 sprintfibuf, "Server: Tiny Web Serveririn"]; 

9 Rio writenifd, buf, strlen[Ibuf)); 

10 

11 if (Fork() == 0) ( /* child */ 

12 /* Real server would set all CGI vars here */ 

13 sertenv["QUERY STRING", cgiargs, 1); 

14 Dup2 (fd, ETDOUT FILENO); í* Redirect stdout to client */ 
15 Execve[filename, emptylist, environ); /* Run СОП program */ 
15 ] 

17 Wait (NULL); A Parent waits for and reaps child */ 

18 |) 


code/netp/tiny/tiny.c 
图 1234 Tinyserve dynamic: АН ЗЕ tapas q 
在 发 送 了 响应 的 第 - -部 分 后 ， 我 们 会 派生 - :个 新 的 子 进程 (第 11 iT. TERAK BECK URI 
的 CGI Z2 ЛЕНІ QUERY STRING 环境 变量 【第 1317). 注意 ，- :个 真正 的 服务 器 将 还 要 在 此 处 
设置 其 他 的 CGIT 环境 变量 。 为 了 简短 ， 我 们 省 略 了 这 - - 步 。 还 有 ， 我 们 注意 到 Solaris 系统 使 用 的 
是 putenv 函数 ， 而 不 是 setenv 函数 。 
接 下 来 ,了 进程 重 定向 它 的 标准 输出 到 已 连接 交 件 描述 符 (第 14 行 )， 然 后 加 载 并 运行 CGI A 
FF CH 15 40. BEDS CGI 程序 运行 在 子 进程 的 上 下 文中 ， 它 能 够 访问 在 亩 用 execve БАН 28 ЕЖ 
在 的 相同 的 打开 文件 和 环境 变量 。 因 此 ，CGI 程序 写 到 标准 输出 上 和 约 任 何 东西 者 将 直接 送 到 客户 庙 
进程 ， 不 会 绎 过 任何 父 进程 多 下 涉 ， 
其 闻 ， 父 进程 阻塞 在 对 wait 的 调用 中 ， 等 待 当 子 进程 终 小 的 时 候 ， 回 收 操 作 系 统 分 配给 了 进程 
的 资源 СА 1747). 
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ЯН. SEIS ЖИЕ 

尽管 一 个 Web B d 506 3 АЯЗҒА, IE AUTOR MEET AERE, Z35835 - АСАН 
Web 8 3-855 3E И Ж). з АКСА А АЙЯ Нан УА A ЕА 4, 
ARG ik UI O48 3E) 3 46 4 L.S 323 Unix ХЫЫ. H, d X— 
个 服务 器 转 一 个 已 经 被 客户 端 关闭 了 的 连接 { eL. E ЖЕ ШИИ EAE Т “Stop” W4), 
那么 第 一 次 这 样 的 号 会 正常 返回 ， 但 是 第 二 次 加 就 溉 引起 发 送 SIGPIPEAR $, KAS U 43 
就 是 终止 这 个 进程 。 加 昧 捕获 求 者 息 略 SIGPIPE $F, MARTAGA- HF егто 
设置 为 EPIPE。strerr 和 perror Ө Kr EPEPE 错误 报告 为 "Broken pipe", 3E - 4-8 8 T 4& $8 
ЖКК, SAC. — d DEOR КОЕ SIGPIPE 9, ЖНЖ wite 
ЖД ИЖ 53 EPIPE Hif. 
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每 个 网 络 应 太 都 是 基于 客户 端 -服务 嚣 模型 的 。 栋 据 这 个 模型 , 一 个 应 用 是 由 - -个 服务 器 和 -个 
或 多 个 客 尸 喘 组 成 的 。 服 务 器 管理 资源 ， 以 某 种 方式 操作 资源 ， 为 它 的 客户 端 提供 服务 。 客 户 问 - 
服务 器 模型 中 的 某 本 操作 是 客户 端 -服务 器 事务 ， 它 是 由 客户 端 请 求 和 跟随 的 服务 器 响应 组 成 的 。 

客户 北 和 服务 器 通过 因特网 这 个 全 球 网 络 来 通信 。 从 一 个 程序 员 的 观点 来 看 ， 我 们 可 以 把 因 特 
网 看 成 是 一 个 全 球 范围 的 主机 和 集合, 具有 以 下 儿 个 属性 : 每 个 因特网 都 有 一 个 惟一 的 32 位 名 字 , Ж 
АГЫР IP МЕҢЕ; IP 地 址 的 集合 映射 为 一 个 因特网 域名 的 集合 ， 不 同 因 特 网 主机 上 的 进程 能 够 道 过 
连接 互相 通信 。 

客户 端 和 服务 器 通过 使 用 矢 接 宇 接口 建立 连接 。 赛 接 字 是 连接 的 端点 ， 对 应 用 程序 来 说 ， 连 接 
是 以 文件 撕 述 符 的 形式 出 现 和 的 。 食 接 字 接 口 提供 了 打开 和 关闭 套 接 字 描 述 符 的 函数 。 客 户 端 和 服务 
器 通过 读 与 这 些 挫 述 符 来 实现 鼻 此 间 的 通信 。 

Web 服务 器 使 用 HTTP 协议 和 它们 的 客户 端 {例如 洲 览 器 ) 和 后 此 通信 。 浏 览 器 向 服务 器 请 求 静 
态 或 者 动态 的 内 容 .对 静态 内 容 的 请 求 是 通过 从 昭 务 器 磁盘 取得 文件 并 把 它 返 回 给 客户 端 来 服务 的 。 
对 动态 内 容 的 请 求 是 通过 在 服务 器 上 一 个 子 进 程 的 上 下 文中 送行 一 个 程序 并 将 它 的 给 出 返回 给 客户 
谢 来 服务 的 。CGI 标准 提供 了 ”组 规则 ， 来 管理 客户 端 如 何 将 程序 参数 传递 给 服务 器 ， 服 务 器 如 何 
将 这 些 参数 以 及 其 他 信息 传递 给 子 进程 ， 以 及 子 进 程 如 何 将 它 的 输出 发 送 固 客户 端 ， 

只 用 几 百 行 C 代 公 就 能 实现 -个 简单 但 是 有 功效 的 Web 服务 器 , 它 既 可 以 提供 静态 内 容 , 也 可 
以 提供 动态 内 容 。 


参考 文献 说 明 

官方 的 有 关 因 特 网 的 信息 源 被 保存 在 一 系列 的 可 免费 获取 的 带 编 号 的 文档 RFC [Requests for 
Comments， 请 求 注解 ，Intemet 标准 (草案 }] 中 。 存 以 下 网 站 可 获得 可 搜索 的 REC ЖЯ. 

nttp: //www.rfc-editor.org/rfc.html 

RFC 通常 是 为 因特网 基础 设施 的 开发 者 编写 的 ， 因 此 ， 对 于 普通 读 首 来 说 ， 往 往 过 于 详细 了 。 
然 出 ， 作 为 权威 信息 ， 没有 比 它 更 好 的 资源 了 。HTTP/1.1 协议 记录 在 ВЕС 2616 P. MIME #10) 
权威 列表 保存 企 : 
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ftpi//ftp.i1si.edu/in-nctes/lana/assignmente/media-types/media-types 

关于 计算 机 网 络 互联 有 大 量 好 的 文献 [44，58，84]， 伟 大 的 技术 作家 W. Richard Stevens 编写 了 
一 系列 关于 诸如 高 级 Unix 编程 [76]、 因 特 网 协议 [77，78，791， 以 及 Unix А [81, 8012 3516 
ШІН ҰЛЫ 认真 学 习 Unix 系统 编程 的 学 生 会 想 要 研究 所 有 这 些 内 容 , ЈЕ, Stevens 在 1999 
*E9 H 1 FE. 我 们 会 永远 纪念 他 的 页 献 。 


ЖЕШ 

126 ФФ 

А.Е Tiny ff A I PR eL ИА ЖАТА НҚ» 

B. 使 用 你 喜欢 的 浏览 器 向 Tiny 发 送 一 个 对 静态 内 容 的 读 求 .把 Tiny 的 输出 记录 到 - -个 文件 巾 。 

C. 检查 Tiny 的 输出 ， 确 定 你 的 浏览 器 使 用 的 НТТР 的 版 本 。 

D. $35 RFC2616 中 的 HTTP/1.1 标准 ,确定 你 的 浏览 器 的 HTTP 请 求 中 每 个 报头 的 合 义 。 你 可 
以 从 www.rfc-editor.org/rfc.html 获得 КЕС 2616. 

127 4% 

扩展 Tiny， 使 得 它 可 以 提供 MPG 视频 交 件 使用-- 个 真 下 的 浏览 器 来 检验 你 的 1 作 。 

128 %% 

修改 Tiny. EREE SIGCHLD ЖЕРЛЕ ПН КЕЕ E BL СОТ ТЕНИ. TERR SE 
式 地 等 待 它们 终止。 

129 Ф% 

修改 Tiny. PASSERA RAA ЫН, (ЕН malloc. rio readn ЖІ rio_writen, fi E mmap ЖП 
rio writen, ТАКУ (ESI ЕЕ А. 

1210 ФФ 

A. 与 出 图 12.26 中 CGI adder ici] HTML 表单 Жж ЕК ЕВ Т ИЖЕ. ЕРЕН 
НД CSS AXIS SCA TED. АЕК ЕН GET 方法 请 求 内 容 ， 

В. 门 这 样 的 方法 来 检查 你 的 程序 : 使 用 一 个 真 下 的 浏览 器 向 Tiny БЖ, |ң Tiny 提交 填写 
好 的 表单 ， 然 后 显示 adder 生成 的 动态 内 容 ， 

1211 4€ 

扩展 Tiny， 以 支持 HTTP HEAD 方法 。 使 用 TELNET 作为 Web 客户 端 来 验证 你 的 工作 。 

1212 49 

扩展 Tiny， 使 得 它 服务 以 HTTP POST 方 蕊 请 求 的 动态 内 容 。 使 用 你 喜欢 的 Web 浏览 器 来 验证 
你 的 工作 ， 

12.13 %%% 

修改 Tiny， 使 得 它 可 以 干净 地 处 理 《〈 而 不 是 终止 ) 在 write 函数 试图 气 -- 个 过 早 英 潮 的 连接 时 
ЖЕН SIGPIPE 信号 和 EPIPE fix. 
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ЈЕ 
AJ 12.1 "EE 


点 分 十 进 制 地 址 


HR 


Dxrttffrff- | 255.255.255.255 
ПхТЕОО0007 127.5.0.1 


— 


бхсарсайб 5 205.188.160.121 


uxdüüdcsbüd 54..2.143.13 


üxcdbcbzl7 iGR.188£.146.23 








练习 题 12.2 答案 
code/netp/hex2dd.c 
1 Kinclude "csapp.h" 
2 
3 int mairíint ағас, char **argv] 
4 { 
5 struct in_addr inaddr; /* addr in network byte order */ 
Б unsignec int addr; Ж addr in host byte order */ 
7 
Н if (ағас (= 2) Í 
9 tprintf(stderr, "usage: €s «hex пилрег>\п", агоу[011; 
10 exit(0); 
11 } 
12 sScaní[argv[l], "Sx", addr}; 
1 inaddr.s addr = htonlíaddr]; 
14 princfíi"ssxn", inet ntoaí(inaddr)); 
15 
16 exit(0); 
17 ] 
code/netp/hex2dd.c 
练习 题 12.3 答案 
code/netp/dd2 hex.c 
1 finclude "csapp.h" 
2 
3 int ша1п{1п© argc, char **агду) 
4 [ 
5 struct in addr inaddr; /* addr in network byte order */ 
6 unsigned int addr; /* addr in host byte order */ 
f 
Н it (ағас != 2) { 
9 tpriatf(stderr, "usage: $s «dotteó-decimal»in", argv[0]); 
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10 exit(0); 
11 } 
12 
13 if (inet atoní(argv[1], &inaddr) == 0) 
14 app errorí("'inet aton error"); 
15 addr = ntohlíinaddr.s addr]l; 
15 printfi"Ox$x^r", addr); 
17 
18 exit!0); 
18 
code/neip/dd2hex.c 
练习 是 12.4 答案 
每 次 我 们 请 米 aol.com 的 主机 条 目 时 , 相应 的 因特网 地 址 列表 以 一 种 不 同 的 、 轮 转 (round-robin ) 
HEM. 
unix» ./hostinfo ао1. сол 


official hostname: aol.com 
address: 205.188.146.23 
address: 205.188.160.121 
address: 64.12.149.13 


unix»-» ./hostinfo aol.com 
official hostname: aol.com 
address: 64.12.149.13 
address: 205.188.146, 23 
address: 205.188.160.122 


unix>> ,./hostinfo aol.com 
official hostname: aol.com 
address: 205.188.146.23 
address: 205.188.160.12- 
address: 64.12.149.13 


在 不 同 DNS trn, БЫНАН АЕ DNS 轮转 (DNS ronnd-robin)， 它 可 以 用 来 对 
一 个 大 量 使 用 的 域名 的 请 求 做 负载 平衡 ， 
练习 题 12.5 答案 


标准 VO 能 在 CGI 程序 里 上 作 的 原因 是 , 在 了 进程 中 运行 的 CGI 程序 不 需要 显 式 地 关闭 它 的 输 
入 输出 流 。 当 子 进程 终止 时 ， 内 核 会 自动 关闭 所 有 描述 符 。 
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并 发 编程 
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13.2 
13.3 
13.4 
13.5 
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13.7 
13.8 


基于 进程 的 并 发 编程 
EFO 多 路 自用 的 并 发 编程 
基于 线程 的 并 发 编程 

多 线程 程序 中 的 共享 变量 

用 信号 量 同步 线程 

еб. 基于 预 线 程 化 的 并 发 服务 器 


其 他 并 发 性 问题 
小 结 
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FARER ЕЗІ, ПДФ st] ЕЕ, ЯА ЕТЕ Я (concurrent2 的 。 
这 种 一 般 堆 象 ， 称 为 并 发 性 (сопсштепсу), НАЕТ RUBUS AS 6 nm. BPO SERERE 
E. HERM Unix 信和 号 处 理 程序 部 是 大 察 很 熟悉 的 鲍 T. 


Ы 


HB Aue. ЗА ACE RUE T ВАРНА (1 AETR. ІНЕ, ЖА 


不 仅仅 局 限于 内 核 , 它 也 可 以 在 应用 程序 中 扮演 重要 角色 。 例如 ， 我 们 已 经 看 到 Unix 信号 处 理 程序 
如 人 柯 允 许 应 用 响应 异步 事件 ， 例 如 用 户 键入 ctrl-ce， 或 者 程序 访问 虚拟 存储 器 (memory) 的 一 个 未 
E Xm. A HATER TRAC P EGERIT: 


在 多 处 理 器 上 进行 并 行 计算 。 在 只 有 -- 个 CPU 的 章 处 理 嚣 上， 并 发 流 是 交替 的 ， 在 任何 时 
间 点 上 ， 都 只 有 AME СРО 上 实际 执行 。 然 而 ， 那 些 有 多 个 CPU ЮВ, КАЎ 
疾 ， 可 以 真 止 地 同时 执行 名 个 流 。 被 分 成 并 发 流 的 并 行 上 应 用 ， 在 这 样 的 机 器 上 上 能 路 运行 得 
快 很 多。 这 对 大 规模 数据 库 和 科学 应 用 花 为 时 要 。 

访问 慢 过 WO 设备 。 当 一 个 应 用 不 在 等 待 来自 慢 束 UO d CES. PRSE SUIT. A 
玄 会 运行 其 他 进程 ， 使 CPU 保持 繁 伦 。 每 个 应 用 都 可 以 以 类 似 的 方式 ， 通 过 交替 执行 VO 
证 求 和 其 他 有 用 的 上 作 ， 来 使 用 并 发 性 ， 

与 人 交 豆 。 秆 计算 机 交互 的 人 朗 求 计算 机 同时 执行 多 个 任务 的 能 轨 。 重 如 ， 和 他们 在 打印 一 
个 文档 时 ， 可 能 想 时 调整 一 个 窗口 的 大 小 。 现 代 视 实 系 统 利用 并 发 性 来 提供 这 种 能 凡 。 每 
次 用 户 请 求 菜 种 操作 (比如 说 通过 单 击 鼠 标 》 时 ， 一 个 独立 的 并 发 逻辑 流 被 创建 来 执行 这 
个 操作 

通过 推迟 工作 以 减少 执行 时 间 . 有 上 时， 应 用 程序 能 够 通过 推进 其 他 操作 并 同时 热 行 它们 ， 
利用 并 发 性 采 降 低 某 些 操作 的 延迟 ， 比 如 ， 一 个 动态 存储 分 配器 可 以 通过 推迟 与 -个 运行 
在 较 低 优先 级 上 的 并 发 “合并 *” 流 的 合并 coalescing y， 使 用 宝 亲 时 的 CPU 周期 ， 来 降低 
单个 free PETER] IER. 

服务 多 个 网 络 客户 端 。 我们 在 第 2AP 2 ЈА А iterative 网 络 服务 器 是 不 现实 的 ， 因 
为 它们 一 深 只 能 为 -个 客户 妆 提 供 服 务 。 因 此 ， 一 个 慢 速 的 客户 端 可 能 会 导 儿 服务器 拒绝 
为 所 有 其 他 客 哺 毅 服 务 ， 对 于 一 个 真正 的 服务 器 来 说 ， 可 能 期 望 它 此 种 为 成 百 上 千 的 客户 
疝 握 供 服 务 ， 一 个 慢 束 客户 出 导致 拒绝 为 其 他 客 广 端 服务 ， 这 是 不 能 接受 的 。 一 个 更 好 的 
方法 是 创建 一 个 并 发 服务 器 ， 它 为 每 个 客户 问 创 建 备 白 独立 的 钠 辑 流 。 这 就 多 许 服 务 路 同 
时 为 多 个 客户 应 服务 ， 并 所 这 也 堆 狗 了 慢 速 客户 端 独 凸 服务 器 。 


使 用 占用 级 并 发 的 应 用 程序 称 为 并 发 程序 (concurrent Program)。 了 现代 操作 系统 提供 了 一 种 基本 
的 构造 并 发 程序 的 方法 ; 


进程 。 用 这 种 方法 ， 每 个 塑 辑 控制 流 都 是 一 个 过 各 ， 由 内 核 来 凋 度 和 维护 。 内 为 进程 布 独 
下 的 典 拟 地 址 宇 间 ， 根 蛇 和 其 他 流通 信 ， 控 制 流 必须 使 用 菜 种 显 式 的 进程 间 通 信 
Cinterprocess communication, IPC? Bil. 

LO $385 fj. (IOP ABR RAET MARERE- ERES L PCT So M ЕЕ; 
ПК СЕЛЕН. BERRA ААҖ... ТЕЛ ЦЫ ДА ТИЫНЫН, JP E 
式 地 从 一 个 状态 转换 到 另 一 个 状态 。 芝 为 程序 是 -分 单独 的 进程 ， 所 以 所 有 的 流 都 共享 癌 
一 个 地 址 空间 。 


. АЖ. HEROS AE ERE КЕТЕ ШШ, ШЕЮ ТИН. fn DEALER 
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КЁ Je KADER y R k. WAMI РАНТА Е, МҮ ПО 多 路 复 用 流 一 样 共 
5g [8] ARRAT. 
本 章 研究 这 二 种 不 同 的 并 发 编程 技术 。 为 了 使 我 们 的 讨论 比较 具体 ， 我 们 始终 以 同一 个 应 用 为 
例 一 一 12.4.9 T rp DS Ç echo 服务 器 的 并 发 版 本 。 
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构造 并 发 程序 最 简单 的 方法 就 是 用 进程 , 使 用 那些 大 家 都 很 熟悉 的 函数 , 像 fork.exec 和 waitpid. 
Вт. -个 构造 并 发 服务 器 的 白 热 方法 就 是 ， 在 父 进 程 中 接受 客户 弟 连 接 请 求 ， 然 后 创建 一 个 新 的 
子 进程 来 为 每 个 新 客户 端 提 供 服务 ， 

为 了 本 解 这 是 如 和 何 工作 的 ， 假 设 我 们 有 央 个 赛 户 癌 和 -~ 个 服务 器 ， 服 务 器 正在 监听 一 个 监听 措 
述 符 《比如 说 是 3) 上 的 连接 请 求 ， 现 在 假设 服务 器 接受 了 客户 端 1 的 连接 请 求 ， 并 返回 -个 已 和 
RHR СКАТ 4), В 13.1 к. 


ея}. анан 


clientfd e listenfdíi) 


clientfi 
13.] 第 一 步 : 服务 器 接受 客户 端的 连接 请 求 
在 接受 连接 请 求 之 后 ， 服 务 器 派生 一 个 子 进程 ， 这 个 子 进 程 获得 服务 器 描述 符 表 的 完整 拱 贝 。 
子 进 程 关闭 它 的 监听 搬 述 街 3, 而 父 进程 关闭 它 的 已 连接 杠 述 符 A. 因为 不 再 需要 这 些 描述 符 了 。 这 
就 得 到 了 图 13.2 中 的 状态 ， 其 中 子 进 程 正 忙于 为 客户 端 提供 服务 。 






数据 传送 


connfd ia] 


listenfd(3) 


clientfd 


[es 


clientfd 


14.2 第 二 步 : 服务 器 派生 一 个 子 进程 为 客户 端 服务 


因为 父 、 子 进程 中 的 已 连接 描述 符 帮 指向 同一 个 文人 性 表 表 项 ， 所 以 父 进 程 关 闭 它 的 已 连接 接 述 
符 征 全 大 重要 的 。 否则， 将 永 不 会 释放 已 连接 描述 符 4 的 文件 表 条 日 ， 而 及 册 此 引起 的 存储 器 泄漏 


734 $us 


КЕЗІНЕН НОТ TH, HARRA. 
AE. ХОН ЖЕРІ ШЕТ TERZE, ERX Г — TED m2. 
JkEI—T E CERTE ОА SO. fui] 13.3 所 示 。 





tonnfdi4) 


elientf ilstenfdi3i] 
^" 
| | 
| 2 connfdís: 
客户 端 2 | 连接 请 求 
clientfd 


图 13.3 第 三 步 : 服务 路 接受 另 一 个 连接 请 求 
然后 ， 父 进程 义 派 生 一 个 税 进 程 ， 使 季 进 冬 用 已 连接 描述 符 5 为 它 的 客 尸 山 提 供 服 务 ， 姑 图 
13.4 所 示 ， 此 时 ， 父 进程 正在 等 待 下 个 连接 请 求 ， 而 两 个 也 进程 正在 同时 为 他 们 各 站 的 客户 闪 提 
ШЕФ. 


КЕ» 子 进程 1 


conntd(4] 


clieatfj lisgtentiii)] 


| 服务 器 





zonntfd(ís: 


图 13.4 第 四 步 : 服务 器 派生 另 一 个 子 进程 为 新 的 客户 端 服务 


13.1.1 基于 进程 的 并 发 服务 器 
图 13.5 Ros 了- 个 基于 进程 的 并 发 echo RB АНЫН, 
code/conc/echoserverp.c 


#1nc_ude "csapp.h" 
void echoíiat connfd); 


void sigchld handler(int sig) 
i 
while (waitpidi-1, 0, WNOHANG) > 0) 


Сп м] C^ іл = d А5 


return: 
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9 | 
10 
12 int mainíint arge, char **argv) 
12 { 
13 int listenfd, connfd, port, clientlen-sizeofí(struct sockaddr іп); 
14 struct sockaddr in clientaddr; 
15 
16 if (argc і= 2) 1 
17 fprintf(stderr, "usage: %5 «port»in', argv[0]):; 
18 exit(0); 
19 ] 
20 port = atoi(argv[1]); 
21 
22 Signal(SIGCHLD, sigchld handler); 
PK listenid - Open, listenfdiport); 
дА while (1) í 
25 connfd = Acceptilistentd, {БА *) &clientaddr, &clientlen); 
26 if (Fork() == D) 1 
7 Closeilistenfd); /* Child closes its listemng socket */ 
28 есһо(соппЁа}; /* Child services client */ 
29 Closeiconnfd); /* Chiki closes connection with client */ 
30 exiti(Q!; % Child exits */ 
31 ) 
34 Close(conntd!; /* Parent closes connected socket (important!) */ 
32 } 
34) 


code/conc/echoserverp.c 


41355 基于 进程 的 并 发 echo 服务 器 
SERRE: Чой) -MPRE REEE AE RRR. 


第 28 行 调用 的 echo ЖА 8] 12.21。 基 于 这 个 服务 器 ， 有 几 点 重 间 内 容 需要 说 明 ， 

. 首先 ， 通 常服 务 回 会 运行 很 长 的 时 间 ， 所 以 我 们 需要 包括 - :个 SIGCHLD ЖЕНЕ, ЖИН 
ЮЕ zombie) T ERE 09 НЕ A 49 $30. E975 SIGCHLD 处 理 程 序 执 行 时 , SIGCHLD 
信号 是 阻塞 的 ， 而 Unix АЗ АЯҒАН, ЖИА SIGCHLD ЖИ EE FASES p ICE ІН 
死 子 进程 的 资源 。 

. 上 其次， 父子 进程 必 肥 关闭 它们 各 自 的 сопа (分 别 为 第 32 行 和 第 29 7) #01. ӨШІП 
已 经 提 旨 过 的 ， 这 对 父 进 程 而 言 尤 为 重要 ， 它 必须 关闭 它 的 已 连接 描述 符 ， 以 避免 存 捅 器 
Hs. 

. XR. [МЧ ЕРИСИ ЧОНИ, А РНЕ АУ connfd 都 关闭 了 ， 到 客户 
端的 连接 才 会 终止。 


13.1.2 ”关于 进程 的 优 劣 
计 于 在 父 、 了 进程 间 其 享 状态 倍 电 ， 进 程 有 一 个 非常 清晰 的 村 型， 其 享 文件 表 ， 但 是 不 共 革 用 
户 地 址 空间 。 有 独立 的 进程 地 址 空间 既是 优点 ， 也 是 缺点 。 这 样 -来 ， 个 进程 不 可 能 不 小 心 姥 盖 
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妨 一 个 进程 的 虚拟 存储 器 ， 这 就 消除 了 许多 令 人 迷惑 的 错误 一 一 这 是 一 个 明显 的 优点 。 

男 一 方 徊 ， 独 并 的 地 址 空间 使 得 进程 共享 状态 信息 变 得 更 加 困难 。 为 了 共享 信息 ， 它 们 必须 使 
Hio IPC (进程 间 通 信 )〉 机 制 。 基 十 进程 的 设计 的 另 一 个 缺点 是 ， 它们 往往 比较 惕 ， 因 为 进程 
控制 和 IPC 的 开销 很 高 ， 


dt. Unix IPC 

在 本 书 中 ,你 已 经 过 到 好 几 个 IPC 的 例子 了 ,第 8 章 中 的 waitpid 函数 和 Unix 司 号 是 基本 的 IPC 
要 制 ， 它 们 元 许 进 程 发 送 小 消息 到 同一 主机 上 的 其 他 进程 ,第 0 $y 43342 R IPC 的 一 种 重要 形 
式 ， 它 妈 许 不 同 主机 上 的 进程 交换 任意 的 字 节 流 . 然而 ,术语 Unix IPC 通常 措 的 是 所 有 万 许 进程 和 
同一 全 主机 上 其 他 讲 程 进行 通 情 的 技术 ， 其 中 包括 管道 、 光 进 先 出 {FIFO )、 系 统 和 VW 共享 存储 器 ， 
VARI VES. ik bau ae T Ad PEE. Stevens 的 著作 [80] 是 很 好 的 大 者 资料 ， 


HJA 13.1 
在 图 13.5 中 ， 半 发 服务 器 的 第 32 LE LHAT E ñ ki. TURA IR ИЯ 
该 描述 特 和 客户 端 通信 ， 为什么? 


ЖЫШ 132 
УЖЖ 13.5 中 关闭 已 连篇 糟 述 符 的 第 29 行 ， 从 没有 存储 器 泄漏 的 角度 来 说 ， 代 友 
将 仍然 是 正确 的 。 为什么? 
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假设 鉴 冰 你 编写 一 个 echo 服务 器 ， 它 也 能 对 用 户 从 标准 输入 键入 的 交互 命令 做 出 响应 。 在 这 种 
情况 下 ， 服 务 器 必须 响应 陵 个 互相 独立 的 UO 事件 ， 网 络 客户 喘 发 起 连接 请 求 ; 用 户 在 键盘 上 键入 
但 令 行 。 我 们 元 等 待 硅 个 事件 昵 ?没有 哪个 选择 是 理想 的 。 如 果 我 们 在 accept 中 等 待 个 连接 请求 ， 
我 们 训 不 能 响应 输入 的 命令 。 类 似 地 ， 如 果 我 们 在 read 中 等 待 -个 输入 命令 ， 我 们 就 不 能 响应 任何 
ЖЖЖ. 

针对 这 种 困境 的 一 个 解决 办 法 就 是 VO 多 路 复 用 (UO multiplexing) 技术 。 基 本 的 思路 就 是 合 
用 select 上 因数， 要求 内 核 持 起 进程 ， 只 有 在 一 个 或 多 个 UO 事件 发 生 后 ， 才 将 控制 返回 给 应 用 程序 ， 
SR Pad Rp FE: 

. 当 焦 合 {0，4]} 中 任意 描述 符 准备 好 读 时 返回 。 

. 当 集 合 {1，2，7} 中 任意 描述 符 准备 好 写 时 返 司 ， 

ь MREFA A IO 事 咎 发 生 时 过 了 152.13 秒 ， 就 超时 。 

select 个 复杂 的 函数 ， 有 许多 不 同 的 使 用 模式 。 我 们 将 只 讨论 第 一 种 模式 ， 等 待 - -组 描述 
符 淮 备 好 读 。 全 面 的 讨论 请 参考 [76，81]。 


#include <unistd.h> 
#include <sys/types.h> 
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int seiectí(int n, fd set *fdset, NULL, NULL, NULL); 
ike obe xe dH EE АЖ. Gba MN o1, 


FD, ZERO(fd set *fdset); /* Clear all bits `n Таче */ 

FD CLR(irt fd, fd set *fdüdset); /* Clear bit fd in fdset */ 

FD SET(int fd, fd, set *fdset); /* Turn on bit fd in fdset */ 

FD ISSET(int fd, [d кес *fdset); /* Is bit fd in fdset turned on? */ 
ДЕЕ ЖЬ, 


select 前 数 处 理 类 型 为 但 _set fee. ВОНА. 逻辑 上 ， 我 们 将 描述 符 集合 看 成 -个 
大 小 为 n Ir TE RS. 





Баң, D Poe 

每 个 位 Б, ANTAR E SERSA ht МАЛАНКА лж. НЛ 
许 你 对 措 述 符 个 合 做 二 忻 事 : 分 配 它们 ; 将 一 个 此 种 类 型 的 变量 赋值 给 男 一 个 变量 ; 出 FD. ZERO. 
FD SET. FD CLR 和 FD_ISSET HA X ЖН]. 

针对 我 们 的 日 的 ，select ARA ADRA: 一 个 称 为 读 业 合 的 描述 符 集 合 〈fdset) ЖИК EGIT 
Just (п). select 基数 会 一 自 阻 时 ， 直 到 读 集 合 中 至 少 看 一 个 描述 符 准 备 好 可 以 读 。 当 所 仅 当 一 
个 从 该 措 述 符 读 了 一 个 字 节 的 请 求 不 会 阻塞 时 , 描述 符 就 表示 准备 好 可 以 读 了 。 作为 一 个 副作用 ， 
select 修改 了 参数 fdset 指向 的 各 _set， 指 明 读 集合 中 -- 个 称 为 准备 好 集合 (ready ве) 的 了 集 ， 这 个 
集合 是 由 读 集 合 中 准备 好 吕 惧 该 了 的 描述 符 组 成 的 。 两 数 返 回 的 慎 指 明了 准 惫 好 集合 的 元 素 量 。 注 
意 ， 由 于 这 个 咕 作 用 ， 我 们 必须 在 每 次 调用 select 时 都 更 新 读 集 人 台 。 

理解 select 的 最 好 办 法 是 研究 一 个 基体 例子， 图 13.6 展示 了 我 们 可 以 如 何 利用 select 来 实现 一 
TA echo 服务 器 ， 它 也 可 以 接受 标准 输入 上 的 用 户 命令 。 


code/conc/select.c 


1 sinclude "csapp.h" 

2 void echo(iaut соппїа!; 

3 моїй command (void); 

á 

5 int maintiint ағас, char **argv) 

Š 1 

7 int 11всепій, connfd, port, clientlen = sizeof(struct sockaddr. ір); 
8 struct sockadar_in ciientaddr; 

9 Га set read set, ready set; 

10 

11 il (арос !- 2) { 

12 tprintf(stderr, "usage: #5 «port»in", argv[0]); 
13 exit (0); 

14 ) 

15 pert = аїо1 (агау [11); 

15 listenfd = Open listenfdiport!; 

17 


18 FD ZE3O(&read set); 
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18 7D SET(STDIM FILENO, &read set!; 

20 Хр SET(listenfd, &read set); 

21 

22 while (1) í 

23 ready set = read set: 

24 Selectí(listenfd-l, &-zeady set, NULL, NULL, NULL]; 
25 if IFD ISSET(STDIN FILENO, &ready set)) 
26 commandi): /* read command line from stdin */ 
27 if iFD ISSZT(listenfd, &ready_set)) í 

28 connfd = Acceptíilistenfd, (SA *J)&clientaddr, &clientlen); 
29 echo(connzd!; /* echo client input until EOF */ 
30 } 

àl } 

32 |) 

33 

34 | void commandívoid) ( 

35 Char buffMAXLINE]; 

36 if (!Fgetsi(buf, MAXLINE, stdinl) 

37 exit {0}; /* EOF */ 

38 printf('€s", bul); /* Process the input command */ 
39 ] 





code/conc/select.c 
156 AVO 多 路 复 用 的 echo 服务 器 
服务 器 司 用 select 等 行 监 昕 撒 述 符 上 的 连接 请求 和 标准 输入 上 的 辣 信 ， 


— 0, RAE 127 中 的 open_listenfd 函数 打开 一 个 监听 描述 符 (第 16 行 )， 然 后 使 用 
FD ZERO 创建 一 个 空 的 读 集合 ; 
listenfd SLAIN 


3 2 1 0 


мәни ГӘ T 9 T T3 


EEX ER 19 一 20 行 中 ， 我 们 定名 由 描述 符 0 标准 输入 ) 和 描述 符 3 (监听 措 述 符 ) 组 成 
的 读 集 合 : 
iistenfd stdin 


3 2 1 9 


人 在 这 里 ， 我 们 开始 典型 的 服务 器 循环 。 也 是 我 们 不 调用 accept ЖЖЖН- ЗЕРЕ, ПЕ 
WAJ select 类 数 ， 这 个 示 数 会 一 直 阻 寨 ， 直 到 监听 描述 符 或 者 标准 输入 准备 好 可 以 读 【〈 第 244). 
例如 ， 上 面 是 当 用 户 殴 击 加 车 键 ， 央 此 使 得 标准 输入 描述 符 变 为 可 读 时 ，seleet 会 返回 的 ready set 
的 值 ; 
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listentd stdin 


3 2. I 8 


—H select АШ, ТІМЕН FD ISSET 宏 指 令 来 判断 哪个 描述 符 准 备 好 可 以 恋 了 。 如 果 是 标准 
输入 准 各 好 了 【第 25 行 )， 我 们 就 调用 command 函数 ， 该 消 数 在 返回 到 证 程序 前 ， 会 读 、 解 析 和 响 
应 命令 。 如 果 是 监听 描述 符 淮 备 好 了 (第 27 行 )， 我 们 就 调用 accept 来 得 着 一 个 已 连接 描述 符 ， 然 
后 调用 图 12.21 中 的 echo 函数 , 它 会 将 来 自 客户 端的 每 一 行 父 回 送 回 去 , 自 到 客户 端 关闭 它 的 连接 ， 

盟 然 这 个 程序 是 使 用 select 的 一 个 很 寻 示 例 ， 侣 是 它 仍然 留 下 了 一 些 问 题 符 解 决 。 问 题 是 一 也 
它 连 接 到 某 个 客户 端 ， 就 会 连续 回 送 输入 行 ， 直 到 客户 端 关 闭 它 的 连接 端 。 因 此 ， 如 果 你 键入 一 个 
命令 到 标准 输入 ， 你 将 不 会 得 到 响应 ， 直 到 服务 器 和 客户 端 之 间 结 束 。 :个 更 好 的 方法 是 更 细 粒 度 
的 多 路 复 用 ， 了 服务 器 每 次 杠 环 【至 和 多) 回 送 一 个 文本 行 (ЦӘ ЫШ 13.3). 


13.2.1 JT VO 多 路 复 用 的 并发 事件 驱动 服务 器 

UO 志 路 技术 可 以 用 敌 并 发 事件 驱动 《eventdriven 》 程序 的 基础 ， 企 事 忻 驱动 中 ， 流 是 作为 某 
种 事件 的 结果 前 进 的 .一 般 概念 是 将 逻辑 流 模型 化 为 状态 机 .不 严 凡 地 说 ,- 个 状态 机 (state machine? 
就 是 一 组 状态 〈state]、 输 入 事件 【input event?) 和 转移 【transition)， 其 中 转移 就 是 将 状态 和 输入 事 
FERIRE. 每 个 转移 都 将 一 对 《输入 状态 和 输入 事件 ) 映射 到 一 个 输出 状态 。 自 循环 (self-loop) 
是 同一 -输入 和 和 输出 状态 之 癌 的 转移 。 通 常 把 状态 机 夯 成 有 向 图 ， 其 中 节点 表示 状态 ， 有 癌 强 表示 转 
物 ， 丙 弧 上 的 标号 表 泵 输入 事件 。 一 个 状态 机 从 某 种 初始 状态 开始 执行 ， 每 个 输入 事件 都 会 引发 一 
个 从 当前 状态 到 上 一 状态 的 转移 。 

N TS SEI mE 基于 VO 多 路 复 用 的 并 发 服务 器 会 创建 一 个 新 的 状态 机 s 并 将 它 和 已 
连接 描述 符 @ 腾 系 起 来 ,如 图 13.7 所 示 , 每 个 状态 机 5 都 有 一 -个 状态 ("等待 描述 符 喜 准备 好 吕 读 "”)、 
一 个 输入 事件 “ШУЙ аа п ДТ”) 和 - 个 转移 СОЗАР df 读 一 个 文本 行 ”)。 


输入 事件 : BEN ÆN 
КҮТЕТІН 


状态 :“ 等 蔡 描 述 符 
аар” 


ЕН. “МОЖА 
d WE — T ECT 











13.7 并 发 事件 驱动 echo 服务 器 中 逻辑 流 的 状态 机 


服务 器 使 用 VO EKSH. EE select 函数 ， 检 测 输 入 种 件 的 发 生 。 当 每 个 已 连 接 描 述 符 准备 
好 可 读 上 时， 服务 项 就 为 相应 的 状态 机 执行 转移 ， 在 这 里 就 是 从 描述 符 读 和 和 写 回 一 个 交 本 行 。 

E 13.8 展示 了 一 个 基于 VO ИНЕ А НАБИ ЗЕН ТИ ЕН, ЖЕЛЕ 
合 维护 在 一 个 pool GO AE CE 3 一 11 行 )。 在 通过 调用 init pool 初始 化 池 《 第 2847) 之 后 ， 
服务 器 进入 -个 无限 桶 环 ,。 在 每 次 柱 环 中 ， 服 务 哄 调用 select 随 数 来 检测 两 种 不 同类 型 的 输入 事件 : 
来 已 一 个 新 客户 请 的 连接 请 求 到 达 ， 一 个 已 存在 的 客户 端的 已 连接 描述 符 准备 好 可 以 法 了 。 当 一 个 
连 嫉 请 求 到 达 时 (第 35 行 )， 服 务 器 打开 连接 UB 36 17), ЛИШ add client 函数 ， 将 该 客户 端 添 
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加 到 池 里 (第 37 行 )。 最 后 ， 服 务 器 调用 check client ІШ, SCORE EL RE TEE rh ЕНЕ 
一 个 文本 行 回 送 回 去 《第 41 47). 


code/conc/echoservers.c 


include "csapp.h" 


typedef struct { /* represents a pool of connected descriptors */ 
int пахта; /* largest descriptor in read. set */ 
fd set read set; #* set of all active descriptors */ 
fd set ready, set; f* subset of descriptors ready for reading */ 
int nready; /* number of ready descriptors from select */ 
int maxi; /* highwater index into client array */ 
int clientfd[FD SETSIZE]; /* set of active descriptors */ 
rio t clientrio[FD, SETSIZE]; /* set of active read buffers */ 
] pool; 


int byte cnt = 0; /*counts total bytes received by server */ 


int mainí(inl argc, char **argv) 


í 


int -istenfd, connfd, port, clientlen = sizeofístruct sockaddr іп); 
struct sockadd- in clientaddr: 
static pool pool; 


if (агас !- 2) 1 
fprintfístderr, "usage; $s «port»in", arqv[0]); 
ех1ї (0); 

} 


port = або1(атду{1]}; 


listenf& = Open listenfdiport); 

init, pocl(listenfd, &pool!: 

while (1) [f 
I* Wat for listemng/connected descriptar(s) to become ready */ 
pool.ready set = pool.read set; 
pool.nready = Selectipool.maxfd«1, &pool.ready set, NULL, NULL, NULL); 


i* |f listening descriptor ready, add new client to pool */ 

if (FD ISSET(listenfà, &pool.ready set)) 1 
cornfd = Acceptí(listenfd, (SA *)&clientaddr, &zlientlen]; 
add client(connfd, &pool); 


/* Echo a text line from each ready connected descriptor */ 
check eclientsíi&pool!; 
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code/conc/echoservers.c 


$138 Xry/OSBEHMEEechoBEzE s 
fi ik Ri do AREA E Ж А TEE e t C RR PO ЖАН. 


init pool ЕЖ (图 13.9) ЕРЕН, cHentfd Ж se esee ge. Huh-l 表示 
一 个 可 用 的 槽 位 。 初 始 时 ， 已 连接 异 述 符 集 合 是 空 的 〈 第 5-7 行 )， 而 且 监 听 描 述 符 基 select WE 
ФЕ RR СФ 10-12 112. 


cade/conc/echaservers.c 


1 void init pooli(int listenfd, pool *p) 
2 l 

3 {* Tnitially, there are no connected descriptors */ 
4 int i; 

5 р->йах1 = -1; 

5 for (1-0; i« FD SETSIZE; із) 

? p->clientfd(il = -1; 

8 

9 {е [nitialiy, listenfd 15 only member of select read set */ 
10 p--maxid = listenfd; 

11 FD ZERO[&kp-»read set); 

12 FD SET[listenfd, &p-»read seb]; 
13 ] 


code/conc/echoservers.e 
图 13.9 init pool: ФИКЕ SIUE р 


add client СЕ 13.100. 8 3⁄0 — ЭЕ P ЖЕ ЖЕ ЖЕР ЭШ. ТЕ clientfd 数组 中 找到 -- 个 空 
Bn. ШЕН ДОХА ЕККЕН rh, ЖАЛЫ НЫШ Rio ЖЕТІК, ЖЕНЕ 
这 个 描述 符 调 用 rio. readlineb C3 8-9 112. 8 Es. 我们 将 这 个 已 连接 描述 符 添 如 到 select ЖА CE 
1247), ЖИ T Ee RR PES maxfd 变量 【第 15 一 16 行 ) 记录 了 select 的 最 人 文件 描述 符 ， 
maxi ЕН (17-18) 记录 的 是 clientfd 数组 的 最 大 索引 ， 这 样 check client 函数 就 无 需 搜索 整 
个 数组 了 。 


code/conc/echoservers.c 
l void add client (ім. connfd, pool *p) 
2 { 
3 int 1; 
4 p-»rready--: 
5 for {1 = 0; 1 < Po SETSIZE; 1++} Ft Find an available slot */ 
Б iL (p-»clientfd]:] < O) í 
7 /* Add connected descriptor to the pool */ 
B p-»clientfd[i] = connfd; 
9 Rio readinitbí(&p-»cliencriolíi], connfd); 
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10 

11 ^* Add the descriptor to descriptor set */ 

12 FD SET(conn£d, &kp-»read set); 

12 

14 /* Update max descriptor and pool highwater mark */ 
15 if (connfd > p-»maxfdi! 

16 p-»maxfd - connfd; 

17 if {i > p:smaxi) 

18 р->йах1 = 1; 

19 break; 

20 } 

71 if (i == FD SETSIZZ) /* Couldn't find an empty slot */ 
22 app error("add client error: Tco many clients"); 
23  ) 


code/conc/echaservers.c 
图 1310 add client: 1—05 Ps EE Bo rh 


check clients 【图 13.10. ER [EDGE ERE EE RED ЕНЕ — T OCA T. RK 
功 邮 从 描述 符 读 取 了 一 个 文本 行 ， 那 各 我 们 就 将 该 文本 行 回 送 到 客户 端 (第 157-1817). HEX. fr 
第 15 行 我 们 维护 着 CAREA ШЕККЕН Н) RB. SKIN Fi КИЕ ЕЛЕЕ 
端 ， 我 们 检测 到 EGF， 那 么 我 们 将 关闭 我 们 这 边 的 连 楼 端 (第 23 行 )， 并 从 池 中 清除 卸 这 个 描述 符 
(第 24 一 25 行 )。 


code/conc/echoservers.c 


1 void check clientsípool *р) 

2 Í 

j int i, ConnEd, п; 

4 char buf[MAXLINE]; 

5 rio t rio; 

& 

7 for ii = 0; (i <= p-»maxi) && ір->пгеаду > 0); 1++) Í 

8 connfd = p-»clienttdii]; 

9 rio = p-»clientriol[il; 

10 

11 “һе descriptor is ready, echo a text [me from it */ 

12 if ((connfd > 9) && (FD ISSET(connfd, &р->геайу set]h)) i 
13 p-»nready--; 

14 itf tin = Зіс readlineb(krio, buf, MAXLINE)) !- D) I 
15 byte cnt += n; 

16 printf("Server received $d ($d tetal) bytes on fd $dXn", 
17 n, byte cnt, conrtd); 

18 Rio, writen(connfd, buf, n); 

19 } 
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21 /* EOF detected, remove descriptor from pool */ 
22 else ( 

23 Close(ccnnfa); 

2А FD CLHiconnfá, &p-»read sei); 
25 p--clientfd[i] = -1; 


code/conc/echoservers.c 
ЕҢ 13.11 check clients: 为 准备 好 的 客户 端 连接 照 务 


根据 图 13,7 中 的 有 限 状态 模型 ，seject 函数 检测 到 输入 事件 , 而 add client 函数 创建 一 个 痢 的 逻 
SEL CRAH). check clients 鹃 数 通 过 回 送 输入 行 来 执行 状态 转移 ， 而 且 当 客户 端 完成 文本 行 发 送 
时 ， 它 还 要 删除 这 个 状态 机 . 


1322 lO 多 路 复 用 技术 的 优 劣 

图 13.8 中 的 服务 器 提供 了 一 个 很 好 的 基于 UO 多 路 揽 用 的 事件 驱动 编程 的 优 缺 点 示例 。 ЧИ 
动 设计 的 一 个 优点 是 ， 它 比 基 于 进程 的 设计 给 了 程序 员 更 多 的 对 程序 行为 的 控制 。 钢 如 ， 我 们 可 以 
没 想 编 写 一 个 事件 驱动 的 并 发 服务 器 ， 为 某 些 客户 端 提供 它们 需要 的 服务 ， 而 这 对 于 基于 进程 的 并 
发 服务 器 来 说 ， 是 很 困难 的 。 

另 一 个 优点 是 ，- -个 基于 VO 多 路 复 用 的 事件 驱动 服务 器 是 运行 在 单一 进程 上 下 文中 的 ， 因 此 
每 个 逻辑 演 都 能 访问 该 进程 的 全 部 地 址 空间 ,这 使 得 在 流 之 间 共 享 数据 变 得 很 容易 。 作 为 单 -- 进 程 
运行 的 - -个 相关 优点 是 ， 你 可 以 利用 热 悉 的 调试 工具 〈 例 姓 GDBO 来 调试 你 的 并 发 服务 器 ， 就 像 对 
版 序 程序 那样 。 最 后 ， 事 件 驱 动 设计 常常 比 基 于 进程 的 没 计 要 明显 地 高 鼓 得 和 多， 因为 它们 不 要 求 有 
进程 上 下 文 切换 来 调度 新 的 流 。 

事件 驱动 设计 一 个 明显 的 缺点 就 是 编码 复杂 , 例如 ， 我们 的 事件 驱动 的 并 发 echo 服务 器 需要 的 
栋 码 比 基 于 进程 的 服务 器 专 三 信 ， 并 是 很 不 幸 ， 随 着 并 发 性 粒度 的 减 小 ， 蓝 杂 性 还 会 上 升 。 这 里 的 
粒度 是 指 每 个 思 辑 流 每 次 时 间 片 执行 的 指令 数 日 。 例 如 ， 在 我 们 的 示例 并 发 服务 器 中 ， 并 发 粒度 就 
是 读 一 个 完 果 的 文本 行 所 需要 的 指令 数 日 。 只 要 某 个 逻辑 流 正 忙 于 读 一 个 文本 行 ， 其 他 膛 辑 流 就 不 
呆 能 有 进展 。 对 我 们 的 例子 而 言 这 就 很 好 了， 但 是 它 第 得 我 们 的 事件 驱动 服务 器 在 “故意 只 发 送 部 
分 文 贾 行 然后 就 停止 ”的 亚 意 客户 端的 攻击 面前 显得 很 脆弱 。 收 改 事件 左 动 服务 器 来 处 理 部 分 文本 
行 不 是 一 个 简单 的 任务 ， 但 是 基于 进程 鹏 设计 却 能 处 理 得 很 好 ， 而 且 是 白 动 处 理 的 。 


练习 题 13.3 

在 大 多 数 的 Unix 系统 蛙 ， 在 标准 输入 上 键入 ctrl-d 表示 EQF。 如 果 体 在 图 13.6 中 的 程序 阻塞 
在 对 select 的 调用 上 时 ， 键 入 ctrl-d SA EAA? 

练习 是 13.4 


图 13.8 所 示 的 服务 器 中 ， 我 们 在 每 次 调用 select 之 前 都 立即 小 心地 重新 初始 化 poolready set 
%%. 为什么? 
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13.3 ”基于 线程 的 并 发 编程 


到 咎 前 为 庄 ， 我 们 己 经 看 到 了 两 种 创建 并 发 逻辑 流 的 方法 。 在 第 .种 方法 中 ， 我 们 为 每 个 流 生 
用 了 单独 的 进 称 。 内 核 会 品 动 调度 每 个 进程 。 每 个 进程 有 它 和 白 己 的 私有 地 址 空间 ， 这 使 得 流 基 上 襄 数 
HIRA. 在 第 一 种 方法 中 ， 我 们 创建 自己 的 逻辑 流 ， 并 利用 WO 多 路 复 用 来 显 式 弛 调度 流 。 国 为 
АН 个 进程 ， 所 有 的 流 共 享 整个 地 址 空间 。 这 一 季 介 绍 第 二 种 方法 一 一 其 于 线程 一 一 它 是 这 两 种 
方法 的 混合 。 

个 线程 Сеад) 就 是 运行 在 一 个 进程 上 下 文中 的 “个 时 辑 流 。 记 今 在 本 书 里 ， 我 们 的 程序 
玫 是 由 一 个 进程 中 一 个 线程 维 成 的 。 催 是 现代 系统 也 允许 我 们 编写 一 个 进程 里 同时 运行 多 个 线程 的 
程序。 线程 出 内 息 自 动 调度 。 每 个 线程 部 有 它 白 己 的 线程 上 下 文 《thread context), 855—448 — 16 
整数 线程 ID (Thread ID，TID)、 栈 、 栈 指针 、 程 序 计数 器 、 通 用 日 的 寄存 器 和 条 件 全。 所 有 的 运 
行 在 一 个 进程 里 的 线程 共享 该 进程 的 整个 虚拟 地 址 空间 。 

基 才 线程 的 逻 钳 流 结合 了 关于 进程 和 基于 LO 多 路 复 用 的 流 的 特性 。 同 进程 一 样 ， 线 程 由 内 核 
日 动 调度 ， 并 二 内核 通过 :个 整数 ID 来 识别 线程 。 问 基于 LO 多 路 复 用 的 流 一 样 ， 包 个 线程 运行 在 
Jo 进程 的 上 下 文中 ， 央 此 具 亭 这 个 进程 虚拟 地 址 室 间 的 整个 内 容 ， 包 括 它 的 已 碚 、 数 据 ， 堆 、 共 
ЖЕЛИ ES CE. 


13.31 ”线程 执行 模型 

多 个 线程 的 执行 异型 在 某 些 方面 和 多 进程 的 执行 烧 型 是 很 相似 的 , 思考 一 让 图 13,12 中 的 示例 。 
每 个 进程 开始 生命 周期 时 都 是 单一 线程 ， 这 个 线程 称 为 主线 程 《main thread)。 在 某 一 时 刻 ， 主 线程 
ШЕ “个 对 等 线程 《peer thread)， 从 这 个 时 间 点 开始 ， 两 个 线程 就 并 发 运行 。 最 后 ， 因 为 主线 积 执 
行 -个 慢 束 系统 调用 ， 例 如 read 或 者 sleep， 或 者 因为 宅 被 系统 的 间隔 计时 器 中 斯 ， 控 制 就 全 通过 
上 下 区 切换 传递 到 对 等 线程 。 在 控制 传递 辐 主 线程 前 ， 对 等 线程 会 执行 一 段 时 间 ， 仿 次 类推， 


时 E, 


线程 1 线程 2 
{ 让 线程 ) (对 等 线程 


JAHRE FESE 


JEREFXEME 


АЕРЫ 





图 13.12 并 发 线程 的 执行 
企 “ 尝 重要 的 方向 ， 线 程 执行 是 不 同 于 进 种 的 。 因 为 一 个 线程 的 上 下 文昌 比 个 进程 的 上 下 文 
小 得 多 ， 线 程 的 上 下文 切 换 要 比 进程 的 上 下 文 切换 快 得 多 。 另 一 个 不 同 就 是 线程 ， 不 像 进程 那样 ， 
个 友 按 虞 严 格 的 父子 层次 来 组 织 的 ,和 一 个 进程 相关 的 线程 组 成 一 个 糙 等 ( 线 释 ) 池 (a роо! of peers), 
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独立 于 其 他 线程 创建 的 线程 。 主 线程 和 其 他 线程 的 区 别 仅 在 于 它 总 是 进程 中 第 一 个 运行 的 线程 。 对 
等 (线程 ) 池 概 念 的 主要 影响 是 ， 一 个 线程 吕 以 杀 死 它 的 任何 对 等 线程 ， 或 者 等 符 它 的 任意 对 等 线 
程 邹 止 。 进 - - 步 来 说 ， 每 个 对 等 线程 都 能 读 写 相间 的 共享 数据 ， 


13.3.2 Posix 线程 

Posix 线程 (Pthreads} EE C 程 序 中 处 理 线程 时 ЮНЕП. TERI 1995 5E, mH 
在 大 多 数 Unix 系统 上 都 可 用 。Pthreads E Ў y K2 60 А, АЙНАНЫҢ. ЖЕЛЕП ДЕТ. 
ч Ж ЖЕК РАН ҖЕ. АРАН АЕ ЕЕ АВО ES. 

图 13.13 展示 了 一 个 简单 的 Pthreads БН. ESFSE—T^MSGE. BE ТЫЛА. XJ 
等 线程 输出 “Hello, werldn ”并 朋 终 止 ， 当 主线 程 检测 到 对 等 线程 终止 后 ， 它 就 通过 调用 exit 终止 


code/conc/heilo.c 
1 *include "csapp.h" 
2 void *їпгеадй{(уо1а *vargp); 
3 
4 int main() 
^ { 
6 pthread, t tid; 
7 Pthread create(&tid, NULL, thread, NULL): 
ü PEhread jointtid, NULL): 
9 ex1- (Ü); 
1C |] 
11 
12 void *threadlvoid *vargp) /* thread routine */ 
i3 Í 
14 rintfi"'Bello, world!*n"); 
15 return NULL; 
16 } 


- — 


Ж 13.13 helo.c: Pthreads “Hello, мола” 程序 


这 是 我 们 看 到 的 第 -个 线程 化 的 程序 ， 所 以 让 我 们 仔细 地 解析 它 。 线 程 的 代码 和 本 地 数据 被 封 
Ж-Е ӨН (thread routine) 中 。 正 如 第 二 行 里 的 原型 所 示 ， 每 个 线程 例 穆 必 以 一 个 通用 指 
外 作为 输入 ， 并 返回 一 个 通用 指针 。 如 果 你 想 传 递 包 个 参数 给 线程 例 程 ， 那 么 你 应 该 将 参数 放 到 -- 
个 络 构 中 ， 并 传递 一 个 指 同 该 结 梅 的 指针 。 硼 似 地 ， 如 果 你 想 要 线程 例 程 返回 多 个 参数 ， 你 可 以 返 
[| — BI] 一 个 结构 的 指针 。 

第 4 行 标 出 了 主线 程 代码 的 开始 。 主 线程 声明 了 一 个 本 地 变量 dd. 它 可 以 用 米 存 放 对 等 线程 的 
线程 ID (H 6 行 )。 主 线程 通过 调用 pthread create 函数 创建 - :个 新 的 对 等 线程 (第 了 60, AN 
pthread_create 的 调用 返回 时 ， 主 线程 和 新 创建 的 对 等 线程 并 发 运行 ， 并 是 ud 包含 新 线程 的 也 。 通 
过 调用 pthread_joia， 主 线程 等 待 对 等 线程 终 小 《第 8 行 )， 最 后 ， 主 线程 调 冉 exit CR o 172, 终止 
当时 运行 在 这 个 进程 中 的 所 有 线程 〈 存 这 个 示例 中 就 只 有 主线 程 )。 

第 127-16 行 定义 了 对 等 线程 的 线程 例 程 。 它 只 打印 一 个 字符 串 ， 然 后 就 通过 在 第 15 行 执行 





codermone/hello.c 
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return 语 杀 来 终止 对 等 线 种 ， 


13.33 创建 线程 
线程 通过 调用 pthread. create FR ЖЕ ИТЕ ЕШ. 


Kinclude <pthread.h> 
typedef void *tfunchivoid *): 


int pthread create(pthread t *tid, pthread attr.t *attr, 
func *f, void Заға); 





ERARO Eum». 


ріһтеай create 上 拓 数 创建 一 个 新 的 线程 ， 并 带 着 一 个 输入 变星 arg， 丰 新 线程 的 上 下 文中 运行 线 
程 例 程 f。 能 用 аш 参数 来 皮 尼 新 创建 线程 的 默认 属性 .改变 这 些 属 性 已 超出 我 们 学 习 的 范围 ， 并 且 
在 我 们 的 示例 中 ， 我 们 总 是 用 一 个 空 的 atr 参数 来 调用 pthread. create 函数 。 

` pthread_create EPIN, E% па 包含 新 创建 线程 的 ID。 新 线程 可 以 通过 调用 pthread_self iR 
数 来 杖 得 它 自己 的 线程 ID，。 


#include «pthread.h» 


pthrea3_t pthread selfívoid); 


返回 调用 者 的 线程 ID， 





13.34 终止 线程 
一 个 线程 是 以 上 列 方 式 之 一 来 终止 的 ; 
. 当 风 层 的 线程 网 程 返回 时 ， 线 程 会 隐 式 地 终止 。 
• 通过 调用 pthread, exit 函数 ,线程 会 昌 式 地 线 目 ,该 函数 会 返回 一 个 指向 返回 值 thread retum 
站 指 什 。 如 果 主 线程 调用 pthread_exit， 它 会 等 待 所 有 其 他 尘 等 线程 终止 ， 然 后 骨 终 小 证 线 
程 和 整个 进程 ， 返 回 值 为 thread. return. 


#include <pttread,h> 


int pthread exit(vo:d *thread return); 


үй hik ul 0, FARAR, 


б KA X SES PEULE] Unix 的 exit 函数 ， 该 函数 终止 进程 以 及 所 有 与 该 进程 相关 的 线程 ， 
. 为 一 个 对 等 线程 通过 带 调用 当前 线程 ID 来 的 pthread_cancle EGER | 当前 线程 。 


*include «pthread.h» 





int pthread cancelí(pthread t tid); 





ЖАНА 0， 车 出 错 则 为 非 零 ， 


1335 ”回收 已 终止 线程 的 资源 
线程 通过 调用 pthread_join 函数 等 待 其 他 线程 终止， 
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include «pthread.h-» 


int pthread joiní[pthread - tid, void **thread return); 


PRAIAS 0, А ЛЕГЕ 





pthread join 函数 会 阳 塞 , НИЕ па € 1E НЕ ЖЕРІНДЕ) void ІНЕ k ii А thread, retum 
所 局 的 位 置 ， 然 后 回收 已 终止 线程 占用 的 所 有 存储 器 资源 ， 

注意 ， 和 Unix 的 wait 函数 不 同 的 ，pthread_join 计数 只 能 等 竺 一 个 指定 的 线程 终止 。 没 有 办 法 
让 pthread wait 等 待 任意 -个 线程 线 站 。 这 使 得 我 们 的 代码 更 加 复杂 ， 内 为 它 迫 使 我 们 去 使 用 其 邮 
一 些 不 那么 直观 的 机 制 来 窜 测 进程 的 终止 。 实 际 上 ，Stevens 在 [81] 中 就 很 有 说 最 力 地 论证 了 这 是 -- 
个 错误 。 


1336 分 离线 程 

在 任何 -- 个 时 间 点 上 ， 线程 是 可 结合 的 (joinable) REESE 04 (detached). — n] £a ime 
程 能 够 被 其 他 线程 收回 其 资源 各 孙 死 。 在 被 其 他 线程 回收 之 前 ， 它 的 存储 器 织 源 《例如 栈 ) АЖ 
放 的 。 相 反 ， 一 个 分 匈 的 线 称 是 不 能 被 其 他 线程 回收 或 杀 抑 的 。 它 的 存储 器 资源 在 它 终 止 时 由 系统 
自动 释放 。 

默认 情 访 下 ， 线 程 锌 创建 成 可 结合 的 ， 为 了 避免 存储 器 汇 漏 ， 每 个 可 结合 线程 都 应 该 坚 么 航 其 
J gee А НЦЫ 0], ЖД ЧН phread detach AART. 


Kinclude «pthread.h» 










| int pthread, detach(pthread t rid]; 
| 





Em bug, Ah АЕ. 

pthread, detach 函数 分 离 可 结合 线程 па. ЕЖЕН pthread. self 为 参数 的 prhread, detach 
ЇЙ HARE A 

尽管 我 们 的 一 些 情 了 会 使 用 可 结合 线程 , 但 是 在 现实 称 序 中 , ЖЕНЯ НЭ ЖИЕ. 例如 ， 
一 个 高 性 能 Web 服务 器 可 能 在 每 次 收 到 Web. 浏览 器 的 连接 请 求 盯 都 创建 一 个 新 的 对 等 线程 。 因 为 
每 个 连接 都 是 由 - -个 单独 的 线 穆 独 立 处 理 的 ， 所 以 对 于 有 最 务 器 而 言 ， 就 很 没有 必要 一 一 实际 上 也 不 
蛛 意 一 一 显 式 地 等 待 每 个 对 等 线程 终止 。 在 这 种 情况 下 ， 每 个 对 等 线程 部 应 该 在 它 开始 处 理 请 求 之 
采 ， 分 离 它 晶 身 ， 这 样 就 能 在 它 终 赴 后 ， 同 收 它 的 存储 器 资源 了 。 
13.3.7 初始 化 线程 

pthread_once 咒 数 允许 你 初始 化 与 线程 例 程 相关 的 状态 。 


#irclude «pthread.h- 


pthread once t once, control = PTHREAD OKCE INÍ^; 


int ptaread once(pthread once t *once control, 
vo;d (*init routine)tivoid!); 
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once control 变量 是 一 个 全 局 或 者 静态 变量 ， 总 是 被 初始 化 为 PTHREAD_ONCE_INIT。 当 你 第 
一 次 用 参数 once control 调用 pthread once 时 ， 它 调用 init_routine， 这 是 一 个 设 有 答 入 参数 ， 也 不 
返回 慎 么 的 阴 数 。 接 下 来 的 以 once control! 为 参数 的 pthread_once 调用 不 做 任何 事情 ，。 无 论 何 时 ， 
当 你 需要 动态 初始 化 多 个 线程 共享 的 全 局 变量 时 ，pthread_once KAENTHA. RIE 13.6 节 
里 大 到 一 个 水 例 。 


13.38 ”一 个 基于 线程 的 并 发 服务 器 

图 13.14 展 水 了 基于 线程 的 计 发 echo 服务 器 的 代码 。 整体 结构 类 似 于 基于 进程 的 设计 。 主 线程 
不 断 节 等 符 连 接 请 求 ， 然 后 创建 一 个 对 等 线程 处 理 该 请 求 。 员 然 代码 看 似 简 单 ， 但 是 有 儿 个 普遍 而 
有 和 些微 妙 的 问题 需要 我 们 更 仔细 地 看 一 看 . 第 一 个 问题 是 当 我 们 调用 pthread, create 时 ， 如何 将 上 
省 接手 述 付 屠 促 纵 对 等 线程 。 最 晨 显 的 方法 就 是 传递 “个 指 辐 这 个 描述 符 的 指针 ， 就 像 下 和 面 这 样 

connfd = Acceptí(listenfd, [SA %) &clientaddr, &clientlen): 

Pthread create[&tid, NULL, thread, &connfd); 

Жон, S do ERES АПАЕ. ЖЕЕ ЮНЕ ЈА ЯЕ Е, ШЕР 


void *thread(void *vargp) ( 
int connfd = *((int =) магор}; 


| 


ЖҮП, xe. КАӘСЕМЕНЕММІНШЕІН ЕБІ accept 语句 国 引 入 了 竞争 
irace)。 如 来 赋值 语句 在下 一 个 accept 之 前 完成 ， 烛 各 对 等 线程 中 的 局 部 变 景 connfd 就 得 到 正确 的 
MEE. ЖІ, Un EATER E) НЕ accept 之 后 才 完 成 的 ， 那么 对 等 线程 中 的 局 部 变量 connfa 就 得 
到 下 次 连接 的 描述 答 值 , 那么 木 率 的 结果 就 是 , 现在 随 个 线程 在 同一 -个 描述 符 上 执行 输入 和 输出 。 
为 了 如 全 这 种 潜在 的 致命 竞争 ， 我 们 必须 将 每 个 accept 返 辐 的 已 连接 措 述 符 分 配 到 它 白 己 的 动态 分 
上 卫 的 存储 器 块 ， 媳 第 20—21 行 所 示 。 我 们 会 在 13.7.4 节 中 回 过 来 讨论 竟 争 的 问题 。 


code/conc/echoservert.c 
Kinclude "csapp.h" 


void echoí(int conrtfd); 
void *tnreadíivoid *vargp!'; 


( 


int listenfd, *connfdp, port, clientlena-sizeof(struct sockaddr im); 


l 

2 

3 

4 

5 

6 int main(int arge, char **arqv) 

5 

E 

© Struct sockadd- in clientaddr; 
1 


Ü pthread t tid; 
11 
12 if (агас != 2) í 
13 tprintfístcerr, "usage: bs «port»in", argv[0]); 


1 MXA phread once. --- 
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24 exit(ü]; 

15 } 

16 pork = atoi(íargv[1]); 

17 

18 listenfd = Ореп listenfdiport); 

19 while (1) í 

20 connfdp = Mallocísizeoftint)); 

21 *connfdp = Acceptí(listenfd, (бА %) &clientaddr, &kczlientien); 
22 Ptnread creakte(&tid, NULL, thread, connfdp): 
23 } 

24 } 

25 


26 * thread routine */ 


27 void *threadivoid *vargpi 


2B | 

29 int cornfd = *((int %)уағар); 
37 Pthread detach(pthread зе1Ї{1\: 
3l Free(vargpl: 

32 echoitconntfd): 

33 Close(connfd); 

34 return NULL; 

ib } 


code/conc/echoseryert.c 


813.14. 基于 线程 的 并 发 G6cho 服务 器 
y 小 问题 是 在 线程 例 程 中 避免 存储 器 泄漏 。 踊 然 我 们 不 显 式 地 收 呵 线程， 我 们 就 必须 分 离 每 
个 线程 ， 使 得 它 的 存储 器 资源 在 它 终 止 时 能 够 被 收回 (第 3017). Er, BP USOS E E 
线程 分 配 的 存储 器 块 CR 3117). 
练习 题 13.5 
在 图 13.5 中 基于 进程 的 服务 器 中 ,我 们 在 两 个 位 置 小 心地 关闭 了 已 连接 描述 符 ， 父 进程 和 子 进 


程 。 然 而 ， 在 图 13.14 中 基于 线程 的 服务器 中 ， 我 们 只 在 一 个 位 置 关 闭 了 已 连接 描述 符 ; 对 年 线程， 
为 什么 ? 


134 ”多 线程 程序 中 的 共享 变量 


从 一 个 释 序 员 的 角度 来 看 ， 线 程 很 有 吸引 方 的 一 个 方面 就 是 多 个 线程 很 容易 共享 相同 的 程序 变 
量 。 然 而 ， 这 种 共 学 也 是 很 坏 于 的 。 为 了 编写 正确 的 多 线程 程序 ， 我 们 必须 对 所 谓 的 共享 以 及 它 是 
如 何 工作 的 有 很 清楚 的 了 解 。 

为 了 理解 程序 中 的 一 个 变量 是 否 是 共享 的 ， 有 -- 些 基本 的 问题 要 解答 :线程 的 基础 存 镶 器 横 
HETA? 根据 这 个 模型 变量 实例 是 如 何 映射 到 存 铺 器 的 ? 最 后 ， 有 多 少 线程 引用 这 些 实例 ?- 
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个 变量 是 共享 的 ， 当 由 仅 当 多 个 线程 引用 这 个 变量 的 某 个 实例 。 

为 了 让 我 们 对 共享 的 讨论 具体 化 ， 我 们 将 使 用 图 13.15 ЕНЕ УАТ АЯ. ЖЕНЕ 
人 为 的 痕 辽 ， 但 是 它 仍 然 人 得 研究 ， 因 为 它 说 明 了 关于 共 时 的 许多 细微 之 处 .不 例 程序 由 一 个 创建 
了 两 个 对 等 线程 的 主线 程 组 成 。 主 线程 传递 一 个 惟 -的 ID 给 每 个 对 等 线程 ， 每 个 对 等 线程 利用 这 
个 ID 输出 一 条 个 性 化 的 信息 ， 以 及 调用 该 线程 例 程 的 全 部 次 数 的 数值 。 


code/conc/sharing.c 


1 &include "csapp.h" 

2 #define N 2 

3 void *thread(void *vargpi; 
4 

5 char **ptr; /* global variable */ 

6 

7 int maní) 

B í 

9 int i; 

10 pthread t tid; 

11 char *msgs[N] = í 

12 "Helio from foo", 

13 "Hello from bar" 

14 H 

15 

16 ptr = msgs; 

17 for (i = Ü; i < N; i++] 
18 pthread_create(&tid, NULL, threac, {void *)il; 
15 pthread_ exit (NULL) ; 

20 | 

21 

42 void *thread(void %уағар) 
23 Í 

24 int myid = !int)vargb; 
25 static int cnt = 0; 

26 printfi("[$d]: %s (спі = +) п", myid, ptr[myid], әәспі); 
27 】 


code/conc/sharing.c 


81315 说明 共 享 不 同方 面 的 示例 程序 


13.41 ЕТЕ ЖЕ! 

-组 并 发 线程 运行 在 “个 进程 的 上 趟 文中 ， 每 个 线程 者 有 它 自己 独立 的 线程 上 下 文 ， 包 括 线程 
本、 栈 、 栈 指针 、 程 序 计 数 器 、 条 件 代码 和 通用 日 的 寄存 器 值 。 每 个 线程 和 其 他 线程 -起 共享 进程 
上 上下文 的 剩余 部 分 。 这 包括 整个 用 户 虚 拟 地 址 空间 ， 它 是 由 只 读 文 本 〔 代 码 )、 读 /号 数据 、 推 以 及 
所 有 的 共享 库 代 码 和 数据 区 域 组 成 的 。 线 程 也 共享 同样 的 打开 文件 的 集合 。 

从 实际 操作 的 角度 来 说 ， 让 一 个 线程 去 读 或 号 另 一 个 线程 的 寄存 器 值 是 不 可 能 的 。 另 一 方面 ， 


并 发 编程 751 


E] £x fé db n] VA UI Та] ЗАО ЕУ В. ШЕТЕН OT T EBERT BS. HA RB 
每 个 线程 最 终 都 能 在 它 读 这 个 位 置 时 发 现 这 个 变化 。 But. АТЕВ ЕЛАТЕ ЫН, MET А 

各 自 独立 的 线程 栈 的 存储 器 模型 不 是 那么 整齐 清楚 的 。 这 些 栈 被 保存 在 虚拟 地 址 宁 舍 的 找 区 域 
中 ， 并 且 通 和 常 是 被 它 们 相应 的 线程 独立 地 访问 的 。 我 们 说 通常 而 不 是 总 是 ， 是 因为 不 同 的 线程 栈 是 
不 对 其 他 线程 设防 的 。 所 以 ， 如 果 一 个 线程 不 知 何故 得 到 一 个 指 癌 其 他 线程 栈 的 措 计 ， 那 么 它 吉 可 
以 读 写 这 个 栈 的 任何 部 分 , 我 们 的 示例 程 序 在 第 26 行 展 示 了 这 一 点 , 其 中 对 等 线程 坟 接 通过 全 局 变 
В ptr 引用 主线 程 的 栈 的 内 容 。 


1342 将 变量 映射 到 存储 器 

ЖЕТЕН C 程序 中 的 变量 根据 它们 的 存 便 类 型 被 映射 到 虚拟 存储 器 。 

. 全 局 变量 ， 件 局 变量 是 定义 在 函数 之 外 的 变量 。 在 运行 时 ， 姑 拟 存储 器 的 读 / 写 区 域 只 包 合 
每 个 全 局 变量 的 一 个 实 鲍 。 例 如 ， 算 5 行 声明 的 全 局 变量 ptr 在 虚拟 存储 器 的 读 / 写 区 城中 
有 -个 运行 时 实例 。 当 -一 个 变量 只 有 一 个 实例 时 ， 我 们 只 用 变量 名 一 一 在 这 里 就 是 pre 
来 表示 这 个 实例 。 

. 术 地 自动 变 董 。 本 地 自动 变量 就 是 定义 在 消 数 内 部 但 是 没有 static 属性 的 变量 。 在 运行 三， 
每 个 线程 的 栈 都 包含 它 自己 的 所 有 本 地 自动 变量 的 实例 。 即 使 客 个 线程 执行 同 - -个 线程 和 例 
程 时 ， 志 是 如 此 。 司 如 ， 有 一 个 本 地 变量 ud 的 实例 ， 它 保存 在 主线 程 的 栈 中 。 我 们 下 idum 
来 表示 这 个 袜 例 ,再 来 看 一 个 例子 , 本 地 变量 туй 有 两 个 实 樟 , 一 个 在 对 等 线 在 0 的 栈 内 ， 
为 - ' 个 在 对 等 线程 1 的 栈 内 。 我 们 将 这 项 个 实例 分 别 表示 为 myid.pü 和 myid.pl. 

* 术 地 神态 变量 。 本 地 青 态 变量 是 定义 在 函数 内 部 着 有 static 属性 的 变量 .和 全 局 变量 一 ' 样 ， 
度 报 存储 器 的 读 / 写 区 域 只 和 包含 在 程序 中 声明 的 每 个 本 地 静态 变量 的 一 个 实例 。 例 如 ， 即 辣 
我 们 示例 程序 中 的 每 个 对 等 线程 部 在 第 25 行 志明 了 са, НАНЫ, БИЛЕ ВС 
域 中 也 只 有 一 个 ent 的 实例 。 每 个 对 等 线程 都 读 和 写 这 个 实例 。 


13.4.3 ”共享 变量 

我 们 说 - -个 变量 vY 是 共享 的 ， 当 县 仅 当 它 的 -个 实例 被 一 个 以 上 的 线程 引用 。 例 如， 我们 未 创 
EHUIBdRE си 就 是 共享 的 ， 因 为 它 只 有 一 个 运行 时 实例 ， 并 且 这 个 实例 被 琴 个 对 等 线程 引用 。 
(£55 Jü, myid 不 是 共享 的 ， 因 为 它 的 两 个 实例 中 每 一 个 都 只 被 一 个 线程 中 用 。 然 而 ， 认 识 到 像 
msgs 这 样 的 本 地 自动 变量 也 能 被 共享 是 很 重 村 的 。 

练习 题 13.6 

А. 利用 134 第 中 的 分 析 ， 为 图 13.15 中 的 示例 程序 在 下 表 的 每 个 条 目 中 填写 “是 ”或 者 “ 耕 ”。 
在 第 一 列 中 ， 符 号 WL 表示 变 章 Y 的 一 个 实例 ， 它 驻 留 在 线程 {t 的 本 地 栈 中 ， 其 中 1 要么 是 mm 1 主线 
f£ XA pO (对 等 线程 中) 或 者 pl (对 等 线程 1) 


变量 实例 主线 程 引用 的 ? 
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B. 根据 A 部 分 的 分 析 ， 变 量 ptr. сп. i. msgs 和 myid 哪些 是 共享 的 ? 


135 由 信号 量 同步 线程 


共 导 释 量 是 上 分 方便 ， 但 是 它们 也 引入 了 同步 错误 【synechronization error) 的 可 能 性 。 考 虑 图 
[3.16 中 的 程序 badentwx， 它 创建 了 两 个 线程 ， 每 个 线程 都 对 其 享 计数 变量 см 加 1. 


-I © іл н is M e 


м с 


an 
AE 


code/conc/badcnt.c 
include "csapp.h" 


define NITERS 1000200600 
void *countívoid *arg); 


/* shared counter variable */ 
uaisigned int слі = 0; 


ілі, maini} 


{ 
pthread t tidl, tid2; 


Pthreac createí&tidl, NULL, count, NULL); 

Pthreac create([&tid2, NULL, count, NULL): 
chreac joinítidl, NJLL); 

Pihread joinitid2, NULL]; 


if (cnt != [unsicned) NITERS*2) 
prinLtfi"BOOM! cnt-$üMn", cnt); 
else 
printfi"OK cnt-$d'in", cnt); 
ex1l1- [0]; 


/* thread routine */ 
void *countivoid *атс} 
l 
int i; 
for {1 = C; i < NITERS; i«-) 
CTIL ++ ; 


并 发 编程 /53 


31 return NULL; 
32 1 
code/concfbadent. c 


Ё 13.6 badcntc: 一 个 处 正确 同步 化 的 计数 器 程序 


因为 每 个 线程 者 对 计数 器 增加 了 NITERS 次 ,我 们 可 能 会 预计 它 的 最 余 值 是 2*NITERS， 然 而 ， 
当 我 们 在 我 们 的 系统 上 运行 badente 时 ， 我 们 不 仅 得 到 错误 的 答案 ， 而 呈 每 次 得 到 的 答案 都 还 不 相 
[n] t 

unix ./badcnt 

BOOM! сЕт=- 198641183 

unix- ./badcnt 

BOOM! ctr-198261801 

unix» ./badcnt 

BOOM! ctr-1988269672 


WARE ETE? Зр Te MUS SEX UE. FU ERU CURES SUL RES. ШЙ 
13.17 所 未 。 我 们 发 现 ， 将 线程 了 的 循环 代码 分 解 成 五 个 部 分 是 很 有 帮助 的 : 

e H, 在 循环 头 部 的 指令 块 ， 

. Lo 加载 兵 享 变量 cot 到 寄存 器 名 eaxi НЇН, AE pear ТЕРІ ІНІ Феак 的 人 第。 

+ [и 更 新 【增加 ) %eax 的 指令 

° Si ЖФеах ЕНЕ ЕН cnt 128%. 

. T: 循环 尾部 的 指令 块 ， 


ЕЖЕН СЫН 


movl -4{%ерр],%гах 
cmpl $32992539,t3eax| > Hi 





РН) G I 
{{=0; i«NITERS; 1++) = movi ctr, weax Li: Load ctr 
certo; leal 1 (%еах}\, ебх Ur Update ctr 
movi &edx,ctr 5,: Store ctr 
mtns mem 
movl -4[kebp),S&eax 
leal 1 {гах}, жейх 
movl kedx,-4(*ebp) Тиң, 


imp .19 


.L12 





613,17 badcnt.c 中 计数 器 循环 的 1АЗ2 汇编 代码 
注意 头 和 尾 只 操作 本 地 栈 变 量 ， 而 L,、U, 和 与 操作 共享 计数 器 变量 的 内 容 。 
73 badent.c 中 的 所 个 对 等 线程 在 一 个 单 处 理 髓 上 并 发 运行 时 ， 机 器 指令 以 某 种 顺序 -个 接 一 个 
地 完成 。 于 此 ， 每 个 并 发 执行 定义 了 两 个 线程 中 的 指令 的 某 种 全 部 (或 者 交 瑟 )。 不幸 地 是 ,这些 顺 
序 中 的 一 些 将 会 产生 正确 结果 ,但 是 其 他 的 则 不 会 。 
这 里 有 个 关键 点 ， 一 般 而 言 ， 你 没有 办 法 预测 操作 系统 是 否 将 为 你 的 线程 选择 一 个 正确 的 顺 


754 БИ: 


Ж. Иш. @13.18 (а) 展示 了 一 个 正确 的 指令 顺序 的 分 步 操作 。 在 督 个 线程 更 新 了 共享 变量 си 
zh. EHE RAIRE 3， 这 正 是 期 望 的 值 。 另 一 方面 ， 图 13.18 Cb》 的 顺序 产生 一 个 不 
正确 的 cut 的 值 。 会 用 生 这 样 的 问题 是 固 为， 线程 在 第 刍 些 加载 eni 是 在 第 2 SERERE mi ent 
SA. MER О FRR I 存储 它 的 更 新 值 之 前 , 因素 ， 每 个 斌 程 周 旧时 都 会 存储 一 个 值 为 1 的 更 
Bi EE EIER GL 





a- | ü | x» | s | [| id | 


га) FANE 








(h) FERNET 


В 13.18 baodcnLc Ф — rb e Nbre t 
ЖҮГЕНІ —# ЗЕ Е TE. (progress graph) E9112 si epi HB ic £e ЖИЙЕН Ж LE B i ЭН 
FHRS. RTBRIBHE F Tii. 


5 SIBI 13.7 
A AT BR. P badentc HAPAA: 


并 发 篇 程 755 





这 种 顺序 会 产生 一 个 正确 的 сш 48957 


13.5.1 ШЕШ 
一 个 进度 图 (progress graph) 将 1 个 并 发 线程 的 执行 模型 化 为 一 条 п 维 向 卡 儿 空间 中 的 轨 线 。 
每 条 轴 对 应 于 线程 上 的 进度 ,每 个 点 (ЛЬ) ARBI А Gelem 已 经 完成 了 指令 天 这 一 
状态 。 图 的 原点 对 应 于 没有 任何 线程 完成 一 条 指令 的 初始 状态 。 
13.19 展示 了 badent.c EF SMERA RRR. 水 平 轴 对 应 于 线程 1, ЖЕНА 
T2B2I. n (Lo S) 对 应 于 线程 ] 完成 了 L. 而 线程 2 完成 了 5, Аж. 
线程 2 





БЕРЕ 1 


H. Li М, 5, T. 


13.19 bodcnt,.c 第 一 次 循环 迭代 的 进度 
-个 进度 图 将 指令 执行 模型 化 为 一 个 从 一 种 状态 到 另 一 种 状态 的 转 接 transition)。- :个 转换 被 
表示 为 一 条 从 一 点 到 硝 邻 点 的 有 向 边 。 合 法 的 转换 是 向 右 (线程 1 中 的 一 条 指令 完成 ) 或 者 向 上 ( 线 
2 中 的 一 条 指令 完成 ) 的 。 两 个 指令 不 能 在 同 - .时刻 完 成 一 对 角 线 转换 是 不 允许 的 。 程 序 决 不 
会 反问 和 运行， 所 以 同 下 或 者 向 左 移动 的 转换 也 是 不 合法 的 。 
一 个 程 席 的 执行 历史 被 模型 化 为 状态 空间 中 的 一 条 轨 线 ,图 13.20 展示 了 下 面 指令 顺序 对 应 的 
B ES: 
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图 13. 芍 “一 个 雪线 示例 


BTOB WERTER cat ЛЕНІ (CL. U. 5) 构成 了 一 个 【关于 共享 变量 cnc 的 ) % 
RE (critical section), ВЕ ТА АНТ ДНА ЗА ра КА Е ЕА ТТ. РА ТУНАН МОЕ ЕА Р 
АО А. Cunsafe region). IB 12.31 展示 了 变量 cnt 的 不 安全 区 。 注意, 不 安全 区 和 与 
tex dH. HATARA RA. ИШ. dd (Hu. HO 3 (S. UD NEPTIS. 
但 是 它们 井 不 是 不 安全 区 的 一 部 分 ， 


Т; 
5; 

"сей ir 
WF u, 





ETITM 
81321 临界 区 和 十 安 全 区 
НЕЕ ЕЕ [ИШЕН e AH (safe trajectory). НІН, ЖЕЕ ЖЛЕ a ee Ж Ж 
ap jk 94 unsafe trajectory 2. Ë] 13.22 Н Г ГН А РЕ badeat.ed [7] 3A 326 [8] sg [F kt RL 37 
全 轴线 。 上 面 的 辆 戌 环绕 下 安全 区 域 的 堪 边 和 上 边 ， 所 以 是 宏 全 的 。 下 面 的 轨 线 穿 赵 不 安全 区 ， 因 
Ed Em. 
IE fn] dz eth e LR IE RUE CHE. Ж T {ЖЕЙЛИ 3 PBU OKB WI IER LET HI 
xke FE [ERE AR I HE E FR D FEE POP ERA ET — f] UL ERES КЕ ФИН. NUES. 
是 有 一 条 安 全 轨 线 ， 


并 发 编程 757 


TX Ri 


5 спі ffl 


Жх 





H 1 


一 一 ”一 一- 一- 
T cnt 的 临界 区 
1322 安全 和 不 安全 雪线 


13.52 利用 情 号 量 访问 共享 变量 

Edsger Dijkstra， 理 解 机 曾 明 二 发 编程 领域 的 先锋 信物， 提出 了 一 种 经 典 的 解决 问 步 不 同 执行 线 
程 问 题 的 方 荡 ， 这 种 方法 是 基于 一 种 叫做 信号 量 【semaphore) ИНЕМЕН, SEs 是 具有 
非 负 整数 值 的 全 局 变量 ， 只 能 由 两 种 特殊 的 操作 来 处 理 ， 这 两 种 操作 称 为 P RI V. 

. P(s ШЖ» ЕЕЕ, ЛА РЖ е1. ЖИНАП, ІҢ 为 委 ， 那 么 就 挂 起 进程 ， 
直到 THER, FERRER -VARFER FEBLI. PHIR siii, H PER 
返回 给 调用 者 。 

. Vís); УЮЙ йз Л 1。 如 果 有 在 何 进程 阻塞 在 PP 操作 等 待 s EAE, БАУМЕН 
这 些 进 程 中 的 一 个 ， 然 后 该 进程 将 * b ZREN PHE 

PERRITA 1 操作 是 不 可 分 割 的 ， 也 就 是 说 , 一旦 预测 5 变 为 非 霉 ,就 会 将 s 减 1， 不 能 有 

中 断 。 V rne 1 握 作 也 是 不 品 分 割 的， 也 就 是 加 载 、 加 1 和 存储 信号 量 的 过 程 中 没有 中 断 。 


ӨЗ, ЖЕ РЖУШЕЙ 


Hdsger Dijkstra h ETHE, 23 Pie V ЖЯ Ж ZEH Proberen (ЖА) 和 Verhogen ( 
Pm). 


疡 和 站 的 定义 确保 了 一 个 运行 程序 绝 不 可 能 进入 这 样 一 种 状态 ， 也 就 是 一 个 正确 初始 化 了 的 信 
号 量 有 一 个 负 信 。 这 个 局 性 称 为 信号 量 不 变性 Csemaphore invatriant)， 为 控制 并 发 称 序 的 轨 线 而 避 
аме ТАН А. 

茎 本 的 思想 是 将 每 个 其 享 变 量 【 或 者 相关 共享 变量 集合 ) 与 - -个 信号 量 s ОЛА 1) 联系 起 来 ， 
然后 用 Pa 和 Was 操 作 将 相应 的 临界 区 包围 起 来 。 以 这 种 方式 来 保护 共 字 变 量 的 信号 量 列 做 二 进 制 
信号 量 〔binary semapbore)}， 因 为 它 的 值 总 是 0 或 者 1. 

图 1323 中 的 进度 图 展示 了 我 们 如 何 利 用 信号 景 来 正确 地 间 步 我 们 的 计数 器 程序 示例 。 每 个 状 
访 都 标 出 了 该 状态 中 信号 量 s 的 信 。 关 键 概念 是 这 种 p 和 操作 的 结合 创建 了 一 组 状态 ， 叫做 禁止 
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È (forbidden region), Ч зе, 825639 806 ЕЕ. WALETA ЖЕЙК Н ІНІ rh f] 
ж. ЖЗ, Bub sede RE T3 ESI, ШЫН аа ЖЕ e [x ЫН 
H4. He. Warka nha R k ai, ТН ЖЕШТЕН ЕЕ R ЕК. PENIS 
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图 1323 WFE SRERJES2 3 
кй ЖК Т ВЕФК ЮЕ. 


ҚИТ 3c LER БРИ VW eee rte ik EC f ЧЕНЕ ГЕ L. ТЕ А НЬ E 
h, ЖЕЕ АЕН ТЕ MER. SEN PERS ГОНЕ ТЕ i Fl Unutually 
exclusive access), ИНЖЕНЕР (mutual exclusion J. 

-Afg НИЯ ed oppor Mc NE S Е (mutex). ЖН ЕШ IESU CUT P 
НЕШ 4. нін, RIT y ҖЫЕП. -теви-ри n pd pop Ti WWW E 
ЖД S m t mt. 
$i ЕЛШЕ 

HERATA- HR ERRER LHA TRE, ——— 
什么 需要 同步 ， Mm. © пае SUA, HaT ESAE LA AX UT. —tt CPU 高速 
сын КИЕ LALA) ЮЕ Ит AA Ех. IUE, — $t 
m$ÉBAESuAET-—HARS, Kr E TUELIBTHIENMUA, Жї. HibbE He: AE 
Jrdpkxi:x4ik. 


13.5.3 Posix $8 
Posix ЕЕ 7 ТІННЕН ШАЯН. —TEGEITHHIER: sem init. sem wai (P SED 和 
sem post CV Bbk). 


并 发 编程 759 


#include semaphore, hə 


int sem inltísem t *sem, 0, unsigned int value); 


int sem waití(sem t *в}; /* P(s) */ 
int sem postí(sem t *a); /* Vis) */ 





Ағы жылы, ERA- 
一 个 程序 道 过 调用 sm init ВА АЕ IRSE., sem init ОНЕ 58 зет 初始 化 为 
value, А EERI D AES. КАІННІҢ, тШ s E. OPF UB ENS 
sem wait 利 sem_post AA ЖАН PAYRE. ГН, ЖИПТЕ ШАКИ А F IP] PURI V RUE wrapper? 
ЖЖ: 


tinclude "csapp.h" 


void Písem t *s); /* Wrapper function for sem маш */ 
vold Ví(sem t *s]; /* Wrapper function for gem post */ 





Иш. A TEREPRE esas], ИПИ СД 8 7 PUS mutex Bin S 8: 
sem t mutex; 

接 下 来 ， 在 主 例 程 中 ， 我 们 将 它 初始 化 为 一 : 

sem init (&mutex, 0. 1); 

最 后 ， 我 们 利用 对 mutex 的 已 和 了 操作 包围 cat 变量 ， 从 而 保护 它 : 


Pi&mutex!; 
Cnt; 
Vi&mutex!; 


13.54 mig R KISS t a ER 

我 们 在 前 - ЗІНІ T ШИН н S So {ЖЫ ta E RETE ЯН. (Е-Е 
用 是 调度 对 共享 资源 的 访问 。 在 这 种 情况 中 ， 一 个 线程 用 信和 号 量 来 通知 另 一 个 线程 ， 程 序 状 态 中 的 
某 个 条 件 已 经 为 真 了 。 图 13.24 所 示 的 生产 者 和 消费 者 模型 是 一 个 经 典 的 示例 。 生 产 者 和 消费 者 线 
种 共享 一 个 有 半 个 槽 的 有 办 缓冲 区 。 





图 13.24 生产 者 -消费 者 模型 
生产 者 产后 项目 (иет) 并 把 它们 莉 入 到 缓冲 区 中 。 应 费 考 从 缓冲 区 中 到 出 这 些 项 目 并 以 某 种 方式 使 用 它们 。 


生产 首 线程 反复 地 生成 新 的 项 目 (item)， 并 把 它们 插入 到 组 冲 区 中 。 消费 者 线程 不 断 地 从 缓冲 
区 中 取出 这 些 项 目 ， 然 后 消费 它们 。 模 型 中 也 可 能 有 不 同 的 生产 者 和 消费 者 数量 。 
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因为 插入 和 取出 项 日 都 包括 更 新 共享 变量 ， 所 以 我 们 此 须 保 证 对 缓冲 区 的 访问 是 互 斥 的 。 但 是 
ПЕН WEE ЖАУЫ, ПЕН АНЫ SUB. nb ЗАН) COHEN, 
那么 生产 着 必 须 等 待 育 到 有 一 个 模 位 变 为 可 用 。 与 之 相似 , 如 果 缓 冲 区 是 空 的 5 没有 可 到 用 的 项 日 )， 
那么 消费 者 必须 等 符 自 到 有 一 个 可 用 的 项 日 。 

生产 者- 消费 普 的 相 巨 作用 在 现实 系统 中 是 很 普遍 的 ， 例 如 ， 在 一 个 多 媒体 系统 中 ， 和 牛 产 者 纺 
公 视 频 帧 ， 而 消费 者 解码 并 在 屏幕 上 呈现 出 来 。 缓 冲 区 的 日 的 是 为 了 减少 视频 流 的 持 动 【jitter)， 而 
这 种 封 动 是 由 各 个 帧 的 编码 和 解码 时 与 数据 相关 的 差异 引起 的 .缓冲 区 为 生产 者 握 供 了 个 槽 位 池 ， 
而 为 消费 者 提供 -一 个 已 编码 的 帧 池 。 另 一 个 常见 的 示 钢 是 图 形 用 户 接 口 的 设计 。 生 产 者 检测 虽 鼠 标 
和 键盘 事件 ， 并 将 它们 插入 到 缓冲 区 中 。 消 费 者 以 某 种 基于 优先 级 的 方式 从 缓冲 区 上 到 出 这 些 事件 ， 
并 男 在 屏幕 上 。 

在 本 廊 中 ， 我 们 将 开发 一 个 简单 的 包 ， 串 向 Sbvf 用 来 构造 生产 者 -消费 首 程 序 。 相 下 一 节 早 ， 
我 们 会 看 到 如 何 用 它 来 构 迁 基于 预 绕 程 化 (prethreading) 的 一 个 有 趣 的 并 发 服务 器 。Sbyf 操作 类 型 
为 sbuf t IBEX С 13.25). 项 目 在 放 在 一 个 动态 分 配 的 n 项 整数 数组 中 。front 和 rear R2 Bid. 
ЖЕН РЧ -项 和 最 后 一 项 。 二 个 信号 量 控制 对 强 冲 区 的 同步 访问 。mutex 信号 量 提供 互 斥 的 
BIRU H. slots 和 items 信和 与 量 分 别 记 录 空 模 位 和 可 用 项 目的 数量 。 


code/conc/sbuf.h 
1 typedef struct 1 
2 int *buf; Ж Buffer array */ 
3 int n; + Maximum number of slots */ 
4 int front; /* buf[(front- 1 )9en] is first item */ 
5 int rear; /* buf[rear?en] is last item */ 
6 sem t muLex; /* Protects accesses to buf */ 
f зет t slots; i* Counts available slots */ 
B aem L items; i* Counts available items */ 
3 ) Sbuf 

code/conc/sbuf.h 





图 13.25 sbuf t: 生产 者 -消费 者 程序 的 一 个 共享 缓冲 区 


sbuf init PR. (Hel 13.26) 为 缓冲 区 分 配 堆 存储 器 ， 设 置 Front 和 rear 表示 一 个 空 的 综 冲 区 ， 并 
为 二 个 信号 量 赋 袖 始 信 。 这 个 函数 在 调用 其 他 三 个 函数 中 的 任何 一 个 之 前 调用 -次 ， 





code/conc/sbuf.c 
1 void sbuf inití(sbuf t *sp, int n) 
2 1 
3 sp-»buf = Callocín, sizeof(int!); 
4 Sp-»n = n; /* Buffer holds max of n items */ 
5 sp-»frcnt = sp-»rear = 0; /* Empty buffer iff front == reur */ 
6 Sem iniL(&sp-»mutex, 0, 1); /* Binary semaphore for locking */ 
7 беш init(&sp-»slots, 0, п); 产 Initially, buf has n empty slots */ 
8 Sem inití(&sp-»items, 0, 0); /* Initially, buf has zero data items */ 
9 ) 

code/conc/sbuf.c 


13.25 sbuf init: 初始 化 一 个 共享 绿 冲 区 


并 发 编程 761 


sbuf deinit i CRS os Ж) ААУ ЖЕЛ S HS E PP pe Ы, ЖЕЛИН DHT 8T) sbuf_insert 
pO 1327) 等 符 -AARM ЯН ЕЮШШ. Н. ЯНЕ И, ЖЕН 
个 新 项 目 可 用 。 


code/conc/sbuf.c 
1 void sbuf :insertisbuf t “ар, int item) 
2 { 
3 Piksp-»slots); /* Wait for available slot */ 
4 Pi&&p-»mutex); /* Lock the buffer */ 
5 sp-»buf[(«2zp-»reari*(sp-»n)] = item; /* Insert the item */ 
6 V(&Sp-»mutex); Ж Unlock the buffer */ 
7 V(&sp-»itemz]; /* Announce avaitable item */ 
8 ] 

code/conc/sbuf.c 


图 13.27 sbuf inser: i£——" AER CBAR SER A TILES 
这 个 函数 - HAGIA .个 模 位 可 用 。 


sbuf remove 函数 【图 13.28) 是 与 sbuf insert 函数 对 称 的 。 在 等 等 一 个 可 用 的 绥 冲 区 项 目 之 
后 、 对 互 太 锁 加 锁 、 从 妇 六 区 的 前 面 取出 说 项 目 、 对 互 斥 锁 和 解锁， 然后 发 信号 遂 知 一 -个 新 的 模 位 
n[ 8t Н. 


code/conc/sbuf.c 
1 int sbu£ removeísbuf t *sp) 
2 1 
3 int item; 
4 D(&5p->1tem5); РЕ Walt for available item */ 
5 P[&8p->mutex); /* Lock the buffer */ 
6 item = sp->buf[(++sp->front)%(sp->n)]; /* Remove the item */ 
] Viksp-»mutex); ж Unlock the buffer */ 
ü Vi&zp-»-slots); Ж Announce available slot */ 
9 return item; 
100) 

code/conc/sbuf.c 


13.28 sbuf remove: 从 一 个 共享 缓冲 区 的 前 部 取出 一 个 项 目 
ZIAN- 直 等 符 到 有 -- 个 项 目 可 用 。 


LESEN E Abr 

їп ose csi emm ERRATAS, LEXEDUEDnNX. Ex, LAAk 
ЗАЛ, BR LAC e XP EXE Ж, =, Java В Р Java Ж 
5 (Java Monitor) [34] 的 机 制 来 同步 的 ， 宫 提 殿 了 对 信号 量 互 斥 和 调度 能 力 的 更 高 级 别 的 抽象 ; X 
际 上 ， 鉴 控 器 可 以 用 情 号 量 来 实现 .再 来 看 一 个 例 了 ，Pthreads 接口 定义 了 一 组 对 互 斥 锁 和 条 件 变 
EHR PH, Phea 互 斥 转 被 用 来 实现 互 斥 。 素 件 亦 量 用 来 调 座 对 共享 资源 的 访问 ， 例 如 在 一 
个 生产 者- 消费 者 程序 中 的 有 有 圈 锭 冲 区 。 
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13.6 5а. 基于 预 线程 化 的 井 发 服务 器 


焦 们 已 经 知道 了 了 如何 忆 用 六 号 量 来 访问 共享 变量 和 调度 对 共享 睦 源 的 访问 。 为 了 帮助 你 更 清晰 
анаған. СЗАН ИГОА Н RI TETERA Cprethreading) 技术 的 井 发 服务 器 
上 ， 


在 图 13.14 申 的 昔 迷 服务 器 中 ， 我 们 为 每 一 个 新 客户 端 创建 了 一 个 新 二 程 ， 这 种 方法 的 成 点 是 
我 们 为 每 一 个 曾 客 户 访 创建 一 个 新 线程 ， 导 政和 垃 小 的 代价 ， 一 个 基于 预 友 程 化 的 服务 同 通 过 使 用 图 
13.29 也 水 的 生产 者 -消费 者 机 型 来 斌 图 降低 这 种 开销 





图 1329 КФ КИЕ ЕНШ Ж ШЕННЕ 
IRL АИ Ho NR UAE BI Ж EUR OE PC HH MGE T 


BOR ЛЕН ТВЕА НО 78 worker КЕННЕН. ЕҢНЕЖФЕНФЕНЕЛШНЕЕНЯЖ. 
КЕНИ НИНЕН aT BÓ — 1 M GE h, 每 一 个 worker SERE ИН DH: h Hii 
NH. SEPIUS, nue TET. 

图 1330 ГАЕТ Sbvf 包 来 实现 一 个 预 线程 性 的 并 发 echo ЕН. (НЕТ НЕ 
区 sbof CR 22 D) 后 ， 主 线程 创建 了 一 起 worker ЕЕ (428-2647). МЕЗА ТСЕ 
ИҢ, EERW. TOREPERUCHERHMGE PENA RUE OPUS. shuf 中 ,每 沾 worker USISI Ж 
ЕШТЕ, OW N Pl REM РСВ ІН TI EFIE MGETE {第 38111. 然后 调用 echo. car ӨН 





国 逆 客户 端的 输入 .。 
w OP cade/conc/echoserveri pre ë 
] "include "csapp.h" 
д Minclude "shuf, hy’ 
3 "dofine NTHREADS 4 
4 Füefine SBUFSIZE 15 
5 
b void echo cnt(iat éóonnfd): 
7 void *thread(void *vargm); 
H 
9 — sbuf.t sbuf; /*shared buffer of connected descriptors */ 
1D 
11 


int main(int arge, char **argv) 


12 
13 
14 
15 
16 
17 
18 
19 
20 
AL 
22 
23 
24 
25 
28 
21 
28 
28 
30 
31 
32 
33 
34 
35 
36 
37 
i8 
39 
40 
41 
42 





并 发 编程 763 


int i, listenfd, connfd, port, clientlenzsizeofistruct sockaddr in|; 
struct sackaddr in clientaddr; 
pthread t tid; 


if (argo !- 2) 1 
fprintfí(stderr, "usage: %5 «port-in', argv[0]): 
exiti(0]; 

) 

port = atol(argv[1]?:; 

sbuf init(&sbuf, SBUFSIZE):; 

listenfd = Open listenfd(port); 


for [i = D; 1 < NTHREADS; i++) /* Create worker threads */ 
Pthread createlktid, NULL, thread, NULL); 


while .ly í 


connfd = Acceptilistenfd, [SA *) &clientaddr, &clientlen); 
Sbuf insertí(&sbuf, соппҒа); /*Insertconnfd in buffer */ 


void *thread(void *vargp) 


Pthread detachí(pthread self ly): 


while (1)! 1 
int connid = sbuf, remcveí(&sbuf);  /* Remove connid from buffer */ 
echo cnticonnfd): /* Service client */ 


Close[connfd!); 


code/conc/echoservert, pre.c 


13.30 一 个 预 线 程 化 的 并 发 echo 服务 器 


这 个 服务 器 使 用 的 是 有 一- 个 生产 者 和 多 个 消费 者 的 生产 者 -消费 者 模型 。 


ЖЖ echo cnt (图 13.31) 是 图 12.21 PH echo 甬 数 的 一 个 版 本 ， 它 在 全 局 变量 byte. ent 中 记录 


TARAR 3018 R 9119 RR VES TIC 





code/conc/echo cnt.c 


finclude "csapp.h" 


static int byte спі; /*bytecounter */ 
Static sem t mutex;  /*andthe mutex that protects it */ 


Static void init echo cnt(void) 


764 # 13 音 


1 

B: бет inití(&mutex, 0, 1): 
E byte cnt = 0; 
1( i 


11 

17 vold есік, cat (int connfd 

13 | 

14 ИЕ n; 

15 char buf[MAXLIHNE]: 

18 гір Е rio: 

17 static рЕһгеаб_опсе_ї once = PTHREAD ОНСЕ ІМІТ; 

15 

13 5PEhread onee(í(&oncme, init. echa. rnt]: 

20 Rio readinitbI&rio, connfd); 

21 while[in = Ria readlinebi(&rio, buf, MAXLIHE)) l= Ô] { 
22 P [Smart ех | : 

84 byte cnt += n; 

24 printfi"thread Wd received d гъа total) bytes on fd wdsn", 
45 (int] pthread self(), n, byte cnr, connfd]; 
26 Vi&mutgx? ; 

47 Rio writen|connfd, buf, n); 

ан 1 

29 | 


code/conc/eche cnt.c 
Ж 1321 echo cnt: echot- tkk, CHU Pagi Rotor E 
А BHN ala ПРУ АТ BIKE), Dd АЕ fos T Te REPE UE FE FH ERE BUT] NC 
HK. ӨТІНЕН, RETE SES] byte cnt id 880 mier КЕ, — b rik R A Shuf 
和 Rio НЛЕЕНЕНІН, ЕВЖЕННИАНЯН-ӘНШІНЕШ, E5—^ fS Gum. Ж 
"КЖКНИН echo, eat EL. ТЕН pihread, once ӨН 1% 1947) K WH BIG. 
i d ERO OC P EE HERE UTERE RE LEES «CPP E EAR S ЖАР —КЩЛЇ] echo: ent # SE PLU 
用 pihread once НЕМ, TIR EEHEEHRRHEITATHEN. 
-H РЇ NIE. echo ent AAA ЧЕ Rio {ИЙЕ IO 包 C 20 r), Ms ois More ^d 
JW Ig —T Zk dT. ЕЕЕ. ЯҒ 23-24 ET tag уе си JUL P| RM: P RO V Ment. 
mit, ЕТИВЕтТЕНШОНИ 
UO £123 T4 CEEREE 4 4 HAF, Mie. ETTI C EE E LA DN GEEK 
X RH &-Ж 4 Ж ЕНА Е, PAEAN worker 06 мкА, ің 
яланға ("Sak EET € “++ = 063 E ü") AA UO FË ("Ж ЖӘЕП" 
deor X Meo hr Hn Se А CHR АЗАУ” Se SMA MLP E Е"), ЖЖ. Ф worker 
"nad — O 503 Aer AMOR HB 7) 一 小 WD Ed "HOPE HE $ bur") — IHRER CUR 
nai X E") 


并 发 编程 765 


13.7 其 他 并 发 性 问题 


你 可 能 己 经 注意 到 了 ， 一 旦 我 们 要 求 同 步 访问 共 译 数据 ， 那 么 事情 就 变 得 更 扣 复 如 了。 迄今 为 
正 ， 我 们 已 经 看 到 了 关于 互 斥 和 生产 者 -消费 省 的 同步 化 技术 ， 但 这 仅仅 是 冰山 一 角 ， 同 步 化 是 非 
常 困难 的 ， 引 出 了 在 普通 的 顺序 程序 中 不 会 出 现 的 问题 。 这 一 小 节 是 关于 你 在 写 并 发 程序 时 需要 注 
意 的 一 些 问 题 的 概括 { 决 不 是 全 面 的 概括 )。 为 了 更 加 其 体 化 , 我 们 将 以 线程 的 形式 描述 我 们 的 讨论 。 
不 过 要 记 住 ， 这 尘 典 型 问题 是 任何 类 型 的 并 发 流 操 作 共 部 资源 时 都 会 出 现 的 。 


1371 线程 安全 

当 我 们 用 线程 编写 程序 时 ， 我 们 必须 小 心地 编写 那些 具有 称 为 线程 安全 性 (thread safety) 属性 
的 函数 ， 一 个 函数 被 称 为 线程 完全 的 《thread-safe )， 当 生 仅 当 被 包 个 并 发 线程 反复 地 调用 时 ， 它 会 
- 直 产 生 正确 的 结果 。 如果 一 个 函数 不 是 线程 安全 的 , ВЕН Зе (thread-unsafe )。 
我 们 能 够 定义 出 四 类 (有 相交 的 ) 线程 不 安全 函数 . 

R13: 不 保护 共享 变量 的 函数 

我 们 在 图 13.16 的 count 函数 中 就 已 经 过 到 了 这 样 的 问题 , БОА ОМ 一 个 末 受 保护 的 全 局 计数 器 
变量 加 1。 将 这 类 线程 不 安全 图 数 变 成 线程 安全 的 ， 相 对 而 言 比 较 容易 :利用 像 呈 和 下 操作 这 样 的 
同步 操作 来 保护 共享 的 变量 。 这 个 方法 的 优点 是 在 调用 程序 中 不 需要 做 任何 修改 ， 缺 点 是 同步 操作 
将 减 慢 程 序 的 执行 时 间 。 

第 2 Ж: 保持 跨越 多 个 调用 的 状态 的 函数 


-个 伪 随 机 数 生成 器 是 这 类 线程 不 安全 将 数 的 简单 例子 ， 请 参考 图 13.32 中 的 伪 随 机 数 生成 器 
ета. 


code/conc/rand.c 
1 unsigned int next = 1; 
2 
3 [* rand - return pseudo-random integer on 0,.22767 */ 
4 int гапа (7014) 
5 I 
б next = next*1103515245 + 12345; 
7 return (unsigned int!í(next/65536) $ 32768; 
8 } 
9 
10 тәп - set seed for rand() *; 
1l void srand(unsigned int seed) 
12 { 
13 next - seed: 
l4 | 
code/canc/rand.c 


图 1332 “ал OBS Em) 


rand В E Sui Т, AA AARRE SIKU (ИШКЕ BP TEL Ж. ARAA srand 
^j rand 俊 置 了 一 个 种 子 后 , 我 们 反复 地 从 -个 单线 程 中 调用 гапа, 我 们 能 够 预期 得 到 一 个 可 重复 的 
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随机 数字 序列 。 然 而 ， 如 果 多 线程 调用 rand ЖШ, ЖБ ТЛ ЕНД D. 

使 得 rand 函 数 为 线程 安全 的 惟一 方式 基 重 写 它 ， 使 得 它 不 再 使 用 任何 静态 数据 ， 取 而 代 之 地 伏 
靠 调用 者 在 参数 中 传递 状态 信息 。 这样 做 的 缺点 是 ， 程 译员 现在 还 要 被 迫 修 改 调用 程序 中 的 代码 。 
在 一 个 大 的 程序 中 ， 可 能 有 成 百 上 干 个 不 同 的 调用 位 置 ， 司 这 样 的 收 改 将 是 非常 又 烧 的 ， 而 日 还 容 
A Uii. 


第 3 类 ， GB ШҮН IRSE 8C TR FT АЖ 

ШЕ (БШ sethostbyname) 将 计算 结果 放 在 静态 结构 中 , E FIL HR k БЕ КЛИ НЕТ. 
A ЖЖП RSE PARGA, ЖОЛИГЕ ЕКЕЖ. EDDIE ET CASI RR 
5)—" 2x TP B TR if Г. 

= ik ЖАШ ЖЕ A AE. -种 选择 是 重 写 函 数 ， 使 得 调用 者 传递 存放 结果 的 结 
构 的 地 址 。 这 就 消除 了 所 有 共享 数据 ， 但 是 它 要 求 程序 员 还 杰 履 写 亩 用 者 中 的 民治。 

如 条 线 程 不 安全 函数 是 难以 修改 或 不 可 能 修改 的 〈 例 如 , 它 是 从 一 个 库 中 链接 过 来 的 )， 堵 么 男 
外 -种 选择 就 是 使 用 我 们 称 为 lock-and-copy C A-D HRR. ADASHE ERAR 
斥 锁 腾 系 了 起 来 。 存 每 一 个 调 攻 位 兽 ， 对 互 斥 锁 加 锁 ， 调 用 线程 不 安全 能 数 ， 动 态 地 为 结果 直 配 存 
慷 器 ， 拷 贝尔 数 返 回 的 结果 到 这 个 存储 器 位 置 ， 然 后 对 互 斥 锁 解锁 。 一 个 吸引 人 的 变化 是 定 半 了 一 
个 线程 安全 的 包装 (wrapper) BEC, CHIT lock-and-copy， 然 后 通过 调用 这 个 包装 消 数 来 取代 所 有 
对 线程 不 安全 函数 的 调用 。 例 如， 图 13.33 给 出 了 一 个 gethostbyname 的 线程 安全 的 版 本 ,利用 的 就 
是 lock-and-copy 技术 。 


第 4 类 ， 调 用 线程 不 安全 阴囊 的 网 数 

HRA НИЛ ЖЛ р, 那么 f 就 是 线程 不 安全 的 蚂 ? 不 - 定 , 如 果 g 是 第 2 ЖИ, 
节 依 赖 于 跨越 多 次 调用 的 状态 ， 那 么 了 也 是 线程 不 安全 的 ， 而 且 除 了 重 写 g Uih REA INE. 
然而 ， 如 果 g 是 第 1 类 或 者 第 3 类 盟 数 ， 那 么 只 要 你 用 “个 互 未 锁 保 护 调用 位 置 和 任何 得 到 的 共 量 
数据 ，f 可 能 仍然 是 线程 安全 的 。 在 图 13.33 中 我 们 看 到 了 一 个 这 种 情况 很 好 的 示例 ， 其 中 我 们 使 用 
lock-and-copy 编写 了 :个 线程 安全 消 数 ， 它 调用 了 一 个 线程 不 安全 的 冰 数 ， 
codewconc/gethosibyname_ts.c 


struct hostent *qethostbyname Евісһаг *hostname) 
i 


struct hostent *sharedp, *unsharedp; 


unsharedp = Mallocisizeofístruct hostent)); 

Pt&mut ex] ; 

sharedp = gethostbynameiaostname!: 

*unsharedp = *sharedp: /* сору shared struct to private struct */ 
V [&mut ex); 


Ü return unsharedp; 
1 


—1 C іл к= Lh Гг 上 一 


Lr = ш о 


code/caonc/gethostbyname t5.c 
13.33  gethostbyname fs: gethostbyname 的 一 个 线程 安全 的 包装 函数 
ӨЗІ lock-and-copy 技术 调用 一 个 第 2 类 线程 不 安全 函数 。 


并 发 编程 767 


137.2 ЖА 

В жа рача, UD GAME (reentrant fanction)， 其 特点 在 于 它们 共有 这 样 
一 种 属性 ， 当 它们 被 多 个 线程 调用 时 ， 不 会 引用 任何 此 享 数 据 。 

尽管 线程 安全 和 可 重信 有 时 会 (不 正确 地 ) 被 用 做 同 头 梧 ， 但 是 它们 之 间 还 是 有 清晰 的 技术 莽 
别 ， 值 得 留意 。 图 13.34 展示 了 可 重 入 用 数 、 线 程 安全 函数 和 线程 不 安全 函数 之 图 的 集合 关系 。 所 
有 攻 数 的 集 台 被 划分 成 不 相交 的 线程 安全 和 线程 不 安全 商 数 华 合 。 可 重 入 函数 集合 是 线程 安全 于 数 
的 : -个 真子 集 。 





13.34 可 利信 函数、 线程 安全 函数 和 线程 不 安全 函数 之 间 的 集合 关系 


可 重信 昔 数 通常 要 比 不 可 量 入 的 线程 安全 的 函数 高 黎 一 些 ， 因 为 它们 不 需要 同步 操作 。 更 进 一 
步 来 说 , 将 第 2 类 线程 不 安全 前 数 转 化 为 线程 安全 函数 的 惟 - -方法 就 是 重 写 它 , 使 之 变 为 可 重信 的 。 
iar, |1335 展示 了 图 13.32 中 тапа 函数 的 一 个 可 重 入 的 版 本 。 关 键 思路 是 我 们 用 一 个 调用 者 传 
递 进来 的 指针 取代 了 静态 的 next ЖШ, 


code/conc/rand r.c 
/* rati. т - a reentrant pseudo-random integer on 0..32767 */ 
int rand r(unsigned int *nextp) 
1 
*nextp = *nextp * 1103515245 + 12345: 
return [unsigned int)i*nextp / 65536) $ 32768; 


CO VP b is bb e 


code/conc/rand r.c 
13.35 rand r: & 13.32 rig rand 函数 的 可 重信 版 本 


HE ОА ЧИЭ ЯА вт ETT ESP E Л), АНЫ? 不 幸 地 是 ， 不 一 定 能 这 样 。 如 果 
入 有 的 毅 数 参数 者 是 传 值 传递 的 《也 就 是 ， 没 有 指针 )， 并 且 所 有 的 数据 引用 都 是 本 地 的 自动 栈 变量 
《也 就 是 ， 没 有 引用 静态 或 全 局 变量 )， 那 么 次 数 就 是 显 式 可 重 入 的 explicitly reentrant)， 也 就 是 
№, ДРЕВНИМИ, ЗЫ ЕЕ А. 

КШ, ЯЧЕЕК В-он, Лал h 83 E5 СЕЖЕ 
说 ， 我 们 允许 它们 传递 指针 )， 那 么 我 们 就 得 到 了 一 个 隐 式 可 重 入 的 【implicitly reentrant) 98%, tE 
就 是 说 ， 在 调用 线程 小 心地 传递 指向 非 共享 数据 的 指针 时 ， 它 才 是 可 重 入 的 。 例 如 ， 图 13.35 中 的 
rand r МК Еа ТЕА р], 

我 们 总 是 使 用 术语 可 重 入 【reentrant } ЫА е ТЕ A р, jm. Wi 
到 可 重 入 性 有 时 同时 是 调用 者 和 被 调用 者 的 属性 ， 并 不 只 是 被 调用 者 单独 的 属性 ， 是 非常 重要 的 。 
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— | | ШЕ set 
图 13.33 中 的 gethostbyname, ts "YT 但 下 是 可 重 入 的 жил, 
13.73 ЕВНИЕВ IE 
KER Unix 甬 数 和 定义 在 标准 C КЕШЕШ (ЖШ malloc. free. realloc. printf 和 scanf) 都 
是 线程 安全 的 ， 只 有 一 小 部 分 是 例外 。 图 13.365 HT Lip. expli pfi ns RET 


| Ж.) 


rand rand r 

КЕЁ atrtok F 

йй. ime agctime т 

crime crime т 

get hostbyaddr Getboatbyaddr т 
| gethostbyname gethosgtbynane т 


inet ntoa 4.1 


1оса1їіте iocaltire r 





图 13.36 ЖШПЕН ЕЕЕ 


asctime. cime 和 localtime FA RE de ЛЕБ ШЖ ЕН [B] HI E [e] ЕЕ А ЕШ. 
pgethostbyname, gethosibyaddr 和 inet ntoa 函数 是 我 们 在 第 12 Spi ЕШ. ЕЖЕНШИЯНАЕҒ 
ШЕ. stok SEE HEB T CUERO BEBE IERI EO FR ЕТЕ ЕНЕ. 

除了 rand 和 sitok 105, Br ix E РЕЛЬ k b hh EE з Ж. ЕЕ О 646 
的 指针 。 吉 时 我 们 需要 在 一 个 吉 厂 程 程序 中 调用 这 些 函 数 中 的 菜 一 个 ， 最 简单 的 方法 是 
lock-and-copy , lock-and-copy 的 缺点 是 先 由 的 同步 降 婚 了 程序 的 速 座 。 更 进一步 , 这 种 方法 对 你 rand 
А ЕКЕШ HB RANN 3 ЖА H ASW. ШИ. Unix EE K ENIRO RISE 
的 可 各 入 路 率 。 可 重 入 版 本 的 名字 总 是 以 “_r” 后 九 结 尾 ， 便 如，gethostbynamsa 的 可 重信 版 本 就 叫 
Ж gethosibyname г. PÆNE. X T Unix ifj] f e EL HB. AERAN Unix 系统 上 有 
МЕНЕП, БЕТІНІҢ, RENDUM. 


1374 ЯЗ 

З T RUFI IEWTER BUE — HERES HERB y AA WISI ENE НЕ ВУ АН, 
AERES (race), ЖЖ ЕЙ Т ДЫ ЭИ ТЕШ Bst He FH p PRAE НЕКЕШ P LET det 
Bl. тшш Г МЕНЕ, ФННЯПРОЯНЯЯН ПГ ТЕ ЕШ Т. 

园子 是 理解 竞争 本 质 的 最 简单 的 方法 。 让 我 们 来 看 看 图 1337 "PES UE. qe RE ЕТЩ 
TARRE. РЕЗА — УЗИ Ру — УНЕ — ВЕ D (libr SL Ski. gto eret С e 
ФЕВ ID 到 一 个 局 部 变量 中 《第 21 T). Hh Е АТО 的 信息 ， 
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code/conc/race.c 


1 include "csapp.h" 

2 tdefine N 4 

3 

4 void *thread(void Ұусғар); 

5 

Б int malní) 

7 | 

8 pthread t tià[N]; 

9 int i; 

iQ 

11 for ti = 0; i < N; i++} 

12 Prthread createtstid(il, NULL, thread, &1!; 
13 for {і = Ü; 1 < N; i++} 

14 Реһгеай join(tid[i], NULL); 
15 exit(0): 

16 |] 

17 


18 /* thread routine */ 
19 void *thread(void *vargp) 


20 Í 

21 int myid = *((int *)varg5); 

22 printf("Hello from thread Sdn", myid); 
23 return NULL; 

24 } 


code/cone/race.c 


13.37 一 个 带 竞 争 的 程序 
它 看 上 去 足够 简单 ， 但 是 当 我 们 在 系统 上 运行 这 个 程序 时 ， 我 们 得 到 以 下 不 正确 的 结果 ， 


Jnix» ./гасе 

Hello from thread 1 
Hello from thread 3 
Hello from thread 2 
Hello from thread 3 


НЕН А ЕЕ 2 TRUE ЕЖЕН. TER DUX T RE? 下 面 是 皮 生 的 情况 ; 
当主 线程 在 第 12 行 创建 了 一 个 对 等 线程 ， 它 传递 了 一 个 指向 本 地 栈 变 量 1 的 指针 。 在 此 时 ， 竞 争 出 
现在 下 一 次 在 第 12 行 调用 pthread. create 和 第 21 行 参数 的 间接 引用 和 赋值 之 间 。 如 果 对 等 线程 在 主 
线程 执行 第 12 行 之 前 就 执行 了 第 21 行 ， 那 么 myid 变量 就 得 到 正确 的 TID。 否则 ， 它 就 包含 的 是 其 
他 线程 的 ID。 令 人 惊慌 的 是 ， 我 们 是 否 得 到 正确 的 答案 依赖 于 内 核 是 如 何 调 度 线程 的 执行 的 。 在 我 
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БЕДЕ. 





{ПЖ ЕЖЕТ. ЕКЕЖ, БОЕ ЕТЕ ГР, СЕЛЕН 


“нн” we B 


rei pes. 
XT ЖП БЕЗ ЕЕ ЫК ID МЕА, ЗЕН КЕНЕНИН t 
НІ “ӘНІН. ШІН 1338 所 示 (第 12—141). ERRER RRA AEA He CLIE e f 


dd. 


"MADE RS Бега. ЖМПВИЕНЕ DESIRES: 


unix» 
Hella 
Hello 
Hello 


Hallo 


fram 
[rom 
From 


from 


a "norace 


thread D 
thread 1 
rhread 2 


thread 3 


ЖЫЮ 13.8 
在 图 13.38 Ф, RITE RE LATE ТУТ APALA 
FAAPE. ed ka ak. 54x] 


5$ 5338 13.10 
А. AM 1338 F, AHAHA ТЕН ID 学 配 一 个 独立 的 抉 来 消除 竟 争 站 出 一 个 不 调用 
malloc 或 者 free && eT E86. 


B. if kd 4 rx? 


іы МИ“ & ы EJ -- 


[ 


= = 5D Чг 


$include * 





esapp.h" 


dédeFine H d 


void *threadivold *тагтр!; 


int maini] 


pthread t tid[N]; 
int i, 'ptr; 
Еёг [i = D; í x Mj із"! [Í 

ptr = Malloc(sizeofiintl); 
*DEE = i; 
Pthread_createištidli], 


NULL, thread, ptr]; 


for [i = D; i < H: isa] 
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17 Pthread joiní(tid[i], NULL); 
18 exitii; 
19 › 


са 


2 

zl  /*thnread routine */ 

22 void *thread(void *vargp) 
z 


304 

24 int myid = *((int *)vargp); 

25 Free [vardp!; 

26 printfí"Hello from thread d\n", myid); 
27 re-urn NULL; 

28-1 


code/conc/norace.c 


1338 图 13.37 中 程序 的 一 个 没有 竞争 的 正确 版 本 


137.5 Sti 
ESEIA — tr b S АЖЕТ ERR. ШИ ЖАЙ 《deadlock)， 它 指 的 是 一 组 线程 被 
EHE DP. ТАНА АНМЕН НАТ НЕЕ AAT. ФП, Bd 13.39 
Жл НАМАС А ЕАН РЕЧ. MBE, ARERR IEK PAESE) 
重要 知识 ; 
* 程序 员 使 用 P 和 VY 操作 顺序 不 当 ， 以 至 两 个 信号 量 的 禁 水 区 域 (forbidden region? Ж. 
ШИТ АМИА ОК А 中 那么 就 不 可 能 有 进一步 的 进展 了, IRAE SIRE 
止 区 域 组 塞 了 每 个 合法 方 避 上 的 进度 。 换 名 话说， 程序 死 锁 是 因为 每 个 线程 都 在 等 待 其 他 
线程 执行- -个 很 不 可 能 发 生 的 本 VY 操 作 ， 
° ЖЕФ t bka[ie ШЖ АЖА АН (deadlock region). 的 状态 。 如 果 - "BLESS E] 
达 了 一 个 死 锁 区 域 中 的 状态 ， 那 么 党 锁 就 是 不 可 避免 的 了 。 轨 线 可 以 进入 死 锁 区 域 ， 但 是 
它们 不 可 能 离开 。 
e 死 锁 是 -个 相当 羽 难 的 问题 ， 因 为 它 不 总 是 可 和 预测 的 。- ' 些 幸运 的 执行 轨 钱 将 绕 开 死 
锁 区 域 ， 而 其 他 的 将 会 陷入 这 个 区 域 。 图 13.39 展示 了 每 种 情况 的 个 示例 。 对 于 程序 
员 来 访 ， 这 其 中 隐 含 的 着 实 令 人 惊慌 。 你 可 以 1000 次 运行 一 个 程序 不 出 任何 问题 ,但 
是 下 一 次 它 就 有 可 能 会 死 锁 。 或 章程 序 在 一 台 机 器 上 可能 运行 得 很 好 ， 但 是 在 男 外 的 
机 器 上 就 会 死 锁 ， 最 糟糕 的 是 ， 错 误 常 常 是 不 可 重复 的 ， 因 为 不 同 的 执行 有 不 同 的 轨 
ek. 
程序 死 锁 有 很 多 原因 ， 要 避免 死 锁 一 般 而 言 是 很 困难 的 。 然 而 ， 当 使 用 二 进 制 信号 量 来 实现 互 
FEIN, Ж 13,39 所 示 ， 你 可 以 应 用 下 面 的 简单 而 有 效 的 规则 来 避免 死 锁 : 
ЕЛАМАН. 如 果 对 于 程序 中 每 对 互 斥 锁 (5, D. PARAS s 也 包含 上 的 线程 都 按 
照相 同 的 顺序 同时 对 它们 加 锁 ， 那 么 这 个 程序 就 是 无 死 锁 的 。 
例如 ， 我 们 可 以 通过 这 样 的 方法 来 解雇 图 13.39 中 的 死 锁 问 题 ， 在 每 个 线程 中 竺 对 s ШЕ. Ж 
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Kippep cuu. BH 13.40 展示 了 得 到 的 进度 图 ， 


ir 


X rider 
ан —— — — | 






en 





намаа 
Pa PB o EI 
图 13.39 ална а 


ЫП 


Pii 


图 13. 牺 ”一 个 无 死 铺 程序 的 进度 图 


Жз] 13.11 
ЖЕТЕ Е, TAHAN- AiE А Е Р, 
ЖЕҢ: sa]. te. 


ч 





HN 
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线程 1 线程 2 
P (6) P (s); 
V (8); V (s); 
P (1); P (t Y 
V (t) V (t); 
A. hik AE RE. 


B. © Ж Ei? 
С. RU XL ҚАЯЖИМЕЗ CES RR АМ 39 PK ТИН КОШ ЖА EQ ЖО 
D. НН ДЕА ARN, 


13.8 小 结 


“个 并 发 程序 是 由 在 时 间 上 重 释 的 一 组 逻辑 流 组 成 的 。 在 这 一 章 中 ， 我 们 学 习 了 三 种 不 同 的 构 
建 并 发 程序 的 机 制 ， 进程 、UO 多 路 复 用 和 线程 。 我 们 以 一 个 并 发 网 络 服务 器 作为 贯穿 全 章 的 应 用 
程序 。 

进程 是 由 内 核 目 动 调度 的 ， 而 且 因为 它们 有 各 自 独 立 的 虚拟 地 址 空间 ， 所 以 要 实现 共 学 数据 ， 
它们 需要 显 式 的 PC 机 制 。 事件 驱 动 程序 创建 它们 日 己 的 并 发 地 辑 流 ， 这 些 逐 辑 流 被 模型 化 为 状态 
HL, H VO 多 路 复 用 来 显 式 地 调度 这 些 流 。 因 为 程序 运行 在 - .个 单 -进程 中 ， 所 以 在 流 之 间 共 序数 
据 速 度 很 快 而 且 很 容易 。 线 程 是 这 些 方法 的 综合 , 同 基于 进程 的 流 -- 样 ,线程 是 由 内 核 自动 调度 的 。 
同 基于 IO 多 路 复 用 的 流 一 样 ， 线 程 是 运行 在 -个 单一 进程 的 上 下 文中 的 ， 因 此 可 以 快速 而 方便 地 
共 圣 数据 。 

无 论 哪 种 并 发 机 制 ， 同 步 对 共享 数据 的 并 发 访问 都 是 一 个 困 准 的 问题 。 提 出 对 信号 量 的 P 和 VY 
操作 就 是 为 了 帮助 解决 这 个 问题 。 信 与 量 操作 可 以 用 来 担 供 对 共享 数据 的 互 斥 访问 ， 也 对 诸如 生产 
考 -消费 普 程 序 中 共享 组 冲 区 这 样 的 资源 访问 进行 调度 。 一 个 并 发 预 线程 化 的 echo 服务 器 提供 了 这 
两 种 信号 量 使 用 场景 的 很 好 的 例子 。 

并 发 性 也 引入 了 其 他 -- 些 困难 的 问题 ,被 线程 调用 的 了 消 数 必须 具有 一 种 称 为 线程 安全 的 属性 。 
我 们 定义 了 可 类 线程 不 安全 函 教 ， 以 及 一 些 将 它们 变 为 线程 安全 的 建议 。 可 重 入 函数 是 线程 安全 
了 番 数 的 -个 真子 集 ， 它 不 访问 任何 共享 数据 。 可 重 入 函数 通常 比 不 可 重 入 函数 更 为 有 效 ， 因 为 它 
们 不 需要 任何 间 步 侣 语 。 竞 争 和 死 锁 是 并 发 程序 中 出 现 的 另 一 些 困难 的 问题 。 当 程序 员 错 误 地 假 
设 逻 辑 流 该 奸 何 调度 上 时， 就 会 发 生 竞争 。 当 一 个 流 等 待 一 个 永远 不 会 发 生 的 事件 时 ， 就 会 产生 死 
Hi. 


参考 文献 说 明 

信和 与 量 操作 是 Dijkstra 提出 的 [24]。 进 度 图 的 概念 是 Coffman{16] 提 出 的 ， 后 来 由 Carson. 和 
Reynolds[10] ERAH]. Butenhof 的 书 [9] 对 Posix 线程 接口 有 全 面 移 描述 。Birrell[4] 的 交 章 对 线程 编 
程 以 及 线程 编程 中 容易 遇 到 的 问题 做 了 很 好 的 介绍 。Pugh 描述 了 Java 线程 通过 存储 髓 进行 充 站 的 
方式 的 缺陷 ， 并 提出 了 替代 的 存储 器 模型 [61]。 
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ЖЕТЕ 

13.12 € 

编写 -个 helloc (Bd 13.13) 的 版 本 ， 使 得 它 创 建 和 回收 п 个 可 结合 的 (joinable ) HARR, 
其 中 是 一 个 命令 行 参数 ， 

13.13 € 

A. 图 13.41 中 的 程序 有 - bug。 要 求 线程 睡眠 一 秒 ， 然 后 输出 AFTE. ЖОП. HERI 
的 系统 上 运行 它 时 ， 却 没有 任何 输出 。 为 什么 ? 

B. 你 可 以 通过 用 两 个 不 同 的 Pthreads 函数 调用 中 的 一 个 替代 第 9 行 中 的 exit АҢ, ПЕ 
ік. XE МК? 

сойеѓсопс/ћеНоБив c 

#include "сварр.ы" 


void *rhreadiycid *vargp); 


1 

2 

3 

4 int maini] 

5 { 

6 pthread, t tid: 
7 

8 

9 


Pthread create(&tid, NULL, thread, NULL); 
ехік(й); 
10 j 


12 f* thread routine */ 


13 void *thread(voic *vargp) 


14 [ 
15 Sleepíl); 
15 printf("Hello, world!in"'); 
17 return NULL: 
i8  ] 
code/conc/hellobug.c 
图 13.41 习题 13.13 的 有 bug 的 程序 
13.14 ++ 


答 合 一 下 你 对 select 函数 的 理解 ， 请 修改 图 13.6 中 的 服务 器 ， 使 得 它 每 次 在 主 服务 器 循环 中 最 
多 只 回 送 一 个 文本 行 。 
13.15 %% 


图 13.8 中 的 事件 驱动 并 发 echo 服务 器 是 有 缺陷 的 ， 因 为 一 信 亚 意 的 客户 端 能 够 通过 发 送 部 分 
的 文本 行 ， 使 服务 器 拒绝 为 其 他 客户 端 服务 。 编 写 一 个 改进 的 服务 器 版 本 ， 司 之 能 够 非 阻塞 地 处 理 
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这 些 部 分 文本 行 。 
1316 9 
Rio VO fir РАЖ (11.4 节 ) 都 是 线程 安全 的 。 它 们 也 都 是 可 重 入 函数 吗 ? 
13.17 Ф 


ЖЕ 13.30 中 的 预 线程 化 的 并 发 echo 服务 器 中 ， 每 个 线程 部 调用 echo cnt EE СЕ 13.13). 
echo, cnt 是 线程 安全 的 吗 ? 它 是 可 重 入 的 吗 ? 为 什么 是 或 为 件 么 不 是 呢 ? 

1318 9€ 

一 些 网 络 编程 的 文献 建议 用 以 下 的 方法 来 读 和 号 套 接 字 : ЖАЛАСЫН, EATR 
已 连接 僵 接 字 描 述 符 上 ， 打 开 两 个 标准 WO 流 ， 一 个 用 来 读 ， 一 个 用 来 扎 ; 


FILE *?р1г‚ *fpout; 


Ғріп = fdcpenisockfd,"r"); 

fpout = fdopenisocktid, "є" ); 

ARAE SE ЛИШ PASE RE. ОҚПАН СІНЕ ҮЙ: 
fcloseifpin); 


fclosei[fpout]; 

АШ. ДИА ТАЈА А DEAS ЖҒНЕ DEG ЗЕ pak tt. 
请 解释 。 

13.19 € 


在 图 13.40 中 ， 将 两 个 操作 的 顺序 交换 ， 对 程序 死 锁 是 否 有 影响 ? 通过 画 出 四 种 可 能 情况 的 
进度 图 来 证 明 你 的 答案 ， 





1320 Ф 
Кама ЖШ? 为什么? 


Initially:a = 1, b = 1, c = 1, 


Thread 1: Thread 2: 
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Plaj; Ріс); 

Fibi; P(b); 

Vib); vih) 

Рісі; міс: 

Vic); 

V (a); 

1321 % 

ЖЕШ лаа, 


Initially:a = 1, b = 1, © = 1. 


Thread 1: Thread 2: Thread 3 
Pla); P (c); Pic); 
P(b): P(b); V(c); 
V (b); Vibl; P (b); 
Ріс}; Vic); Р(а); 
Yig}; Piaj; уңа); 
v(a); уңа); V(bl: 


A. 列 出 每 个 线程 同时 保持 的 一 对 互 奈 锁 。 
B. 如 果 ас, ВАВА В ЛР АТ? 
C. 对 于 这 些 线程， 指出 一 个 新 的 保证 不 会 发 生死 锁 的 加 锁 顺 序 。 


1322 ФФ% 

实现 标准 的 TO 函数 рес 的 一 个 版 本 , 叫做 tfgets, 假如 它 在 5 秘 之 内 没有 从 标准 输入 上 接收 到 
一 个 输入 行 ， 那 么 就 超时 ， 并 返回 一 个 NULL 指针 。 你 的 函数 应 该 实现 在 一 个 叫做 tfgets-select.c 的 
和 包 中 ， 使 用 进程 、 信 号 和 非 本 地 跳 转 。 它 不 应 该 使 用 Unix 的 alarm 函数 。 使 用 图 13.42 中 的 驱动 程 
序 测试 你 的 结果 ， 


13.23 ФФ% 

使 用 select 前 数 来 实现 练习 题 1322 中 tfgets 隐 数 的 一 个 版 本 ,你 的 函数 应 该 在 一 个 叫 收 
tfgets-select.c 的 包 中 实现 。 用 练习 题 13.22 中 的 驱动 程序 测试 你 的 结果 。 你 可 以 假定 标准 输入 被 赋 
值 为 描述 符 零 。 


1324 99 
实现 练习 题 13.22 中 tfgets 函数 的 一 个 多 线程 版 本 。 你 的 函 教 应 该 在 一 个 叫做 fgets-select.c 的 
包 中 实现 ,用 练习 题 13.22 中 的 驱动 程序 测试 你 的 结果 。 


1325 ФФ9% 
实现 一 个 基于 进程 的 Tiny Web 服务 器 的 并 发 版 本 。 你 的 解答 应 该 为 每 一 个 新 的 连接 请 求 创建 一 
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个 新 的 子 进程 。 司 用 一 个 实际 的 Web 浏览 器 来 测试 你 的 和 解答。 


code/conc/tfgets-main.c 


= 


#include "caapp.h" 


3 Char *tfgetsicnar *s, int size, FILE *stream); 
à 
5 int maini) 
Š { 
7 char buf [MAXLINE]; 
B 
9 if (tfgets(buf, MAKLINE, stdin) == NULL! 
10 ртіп? { "ЗООМ! ҳлд"); 
11 eise 
12 printfí"*s", puf): 
13 
14 exit (0); 
15 ] 
code/canc/tfgets-main.c 
图 13.42 习题 1322—13.24 的 驱动 程序 
1326 %%% 


实现 一 个 基于 UO 多 路 复 用 的 Tiny Web 服务 器 的 并 发 版 本 . 使 用 一 个 实际 的 浏览 器 来 测试 你 的 
解答 。 
1327 %%% 


实现 一 个 基于 线程 的 Tiny Web 服务 器 的 并 发 版 本 。 你 的 解答 应 该 为 每 一 个 新 的 连接 请 求 创建 一 
个 新 的 线程 。 使 用 -个 实际 的 浏览 器 来 测试 你 的 解答 。 


1328 99699 
实现 一 个 Tiny Web 服务 器 的 并 发 预 线程 化 的 版 本 。 你 的 解答 应 该 根据 当前 的 负载 , 动态 地 增加 


或 减少 线程 的 数目 。 一 个 策略 是 当 缓 溃 区 变 满 时 ， 将 线程 数量 翻 倍 ， 而 当 缓 溃 区 变 为 空 时 ， 将 线程 
数 日 减 半 。 使 用 一 个 实际 的 浏览 器 来 测试 你 的 解答 。 


13,22 %%Ф%% 

Web 从 理 是 一 个 在 Web 服务 器 和 浏览 器 之 问 扮演 中 间 角 色 的 程序 。 浏览 器 不 是 直接 连接 服务 器 
以 获 融 网 页 ， 而 是 与 代理 连接 ， 代 理 再 将 请 求 转发 给 服务 器 。 当 服务 器 响应 代理 时 ， 代 理 将 响应 发 
送 给 浏览 器 。 实 现 这 个 试验 ， 请 你 编写 一 个 简单 的 可 以 过 滤 和 记录 请 求 的 Web 代理 : 

А. 试验 的 第 一 部 分 中 ， 你 要 建立 以 接收 请 求 的 代理 ， 分 析 HTTP， 转 发 请 求 给 服务 器 ， 并 且 返 
回 结 此 给 浏览 器 ,你 的 代理 将 所 有 请 求 的 URL 记录 在 磁盘 上 一 个 日 志文 件 中 , 同时 它 还 要 阻塞 所 有 
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对 包含 在 磁盘 上 一 个 过 滤 文 件 中 的 URL 的 请 求 。 

B. 试验 的 第 二 部 分 中 ,你 要 升级 你 的 代理 , 它 通 过 派生 一 个 独立 的 线程 来 处 理 每 一 个 请 求 ， 使 
得 你 的 代理 能 够 一 次 处 理 包 个 打开 的 连接 。 当 你 的 代理 在 等 待 远程 服务 器 咏 应 一 个 请 求 使 它 能 服务 
于 ”个 浏览 器 时 ， 它 应 该 可 以 处 理 来 自 另 一 个 浏览 器 未 完成 的 请 求 。 

使 用 一 个 实际 的 浏览 器 来 检验 你 的 解答 。 


练习 题 答 案 


练习 题 13.1 答案 

当 父 进程 派生 于 进程 时 ， 它 得 到 一 个 已 连接 描述 符 的 副本 ， 并 将 相关 文件 表 中 的 引用 计数 从 1 
增加 到 2. 当 父 进程 关闭 它 的 描述 符 副 本 时 , 引用 计数 就 从 2 减少 到 1, 因为 内 核 不 会 其 闭 一 个 文 性 ， 
直到 文件 表 中 它 移 引用 计数 值 变 为 零 ， 所 以 子 进 程 这 边 的 连接 端 将 保持 打开 ， 


练习 题 13.2 答案 
当 - 一 个 进程 因为 某 种 原因 终止 时 ， 内 核 将 关山 所 有 打开 的 描述 符 。 因 此 ， 当 子 进程 退出 时 ， 它 
的 连接 立 忻 描述 符 的 副本 也 将 被 白 动 关闭 。 


练习 题 13.3 EX 

回想 一 下 ， 如 果 一 个 从 描述 符 中 读 -个 字 节 的 请 求 不 会 阻塞 ， 那 么 这 个 描述 符 就 准备 好 可 以 读 
T. Ж EOF 在 一 个 描述 符 上 为 真 , 那么 描述 符 也 准备 好 可 读 了 , 因为 读 操 作 将 立即 返回 一 个 零 返 
ІНЕ, 37 EOF。 因 此 ， 键 入 ctrl-d 会 导致 “есі 函数 返回 ， 准 备 好 的 集合 中 有 描述 符 О. 


练习 题 13.4 ЖЖ 
四 为 变量 pool.read set 既 作 为 输入 参数 也 作为 输出 参数 ， 所 以 我 们 在 每 次 调用 select 之 前 部 
重新 初始 化 它 。 在 输入 时 ， 它 包含 读 集 舍 。 在 输出 ， 它 包含 准备 好 的 集合 ， 


练习 题 13.5 答案 

因为 线程 运行 在 同一 个 进程 中 ， 它 们 都 共享 相同 的 描述 符 表 。 无 论 有 多 少 线程 使 用 这 个 已 连接 
描述 符 ， 这 个 已 连接 摊 述 符 的 文件 表 的 引用 计数 都 等 于 一 。 因 此 ， 当 我 们 用 完 它 时 ， 一 个 close |ë 
作 就 足以 释放 与 这 个 已 连接 描述 符 相 关 的 存储 器 资源 了 。 


练习 题 13.6 答案 
这 并 的 主要 的 意思 是 说 ， 当 共享 全 局 和 静态 变量 时 ， 静 态 变 量 是 私有 的 。 诸 如 спі 这 样 的 静态 
变量 有 点 小 麻 煤 ,因为 共享 是 限制 在 它们 的 函数 范围 内 的 一 一 在 这 个 例子 中 ， 就 是 线程 例 程 ， 
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. рї: -个 被 主线 程 写 和 被 对 等 线程 读 的 全 局 变量 。 

* cnt: 一 个 静态 变量 ， 被 两 个 对 等 线程 读 和 写 ， 在 存储 器 中 只 有 一 个 实例 。 

• im: -- 个 存储 在 主线 程 找 中 的 本 地 自动 变量 。 有 虽然 它 的 值 被 传递 给 对 等 线程 ， 但 是 对 等 线 
程 也 决 不 会 在 栈 中 引用 它 ， 因 此 它 不 是 共享 的 。 

• mgm: 一 个 存储 在 主线 程 栈 中 的 本 地 自动 变量 ， 被 两 个 对 等 线程 通过 ptr 间接 地 引用 。 

• у11.0 和 myia.1， 分 别 驻 留 在 对 等 线程 0 和 线程 1 的 栈 中 的 一 个 本 地 自动 变量 的 实例 。 

B. 变量 ptr. cnt 和 msgs 被 多 于 一 个 线程 引用 ， 因 此 它们 是 共享 的 。 


练习 题 13.7 答案 
这 时 的 重要 思想 是 ， 你 不 能 假设 当 内 核 调 度 你 的 线程 时 ， 会 如 何 选择 顺序 。 





X cnt ЖАН -一 个 不 正确 的 值 一 一 1， 


练习 题 13.8 ЖЕ 


gethostbyname ts 允 数 不 是 可 重 入 函数 ， 因 为 每 次 调用 都 共享 相同 的 由 gethostbyname FE GR 
的 static 变量 。 然 而 ， 它 是 线程 安全 的 ， 因 为 对 共享 变量 的 访问 是 被 严 和 了 操作 保护 的 ， 因 此 是 互 
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ЕВ, 


ЕЗЕ 139 答案 

ШТИТЕ 15 行 调用 了 prhread create 之 后 ， ЗЕН ВЕ ВАЕ, MARTAGA ТВОЕ Я, 
这 次 竞争 发 生 在 主线 程 对 free 的 调用 和 线程 个 程 中 第 25 TET OC 8] Pu. 

ЕЛІН 13.10 € 

A, ИЕН EHE k A. m HeEmIB—TBE ІНЕН: 

tar [i e D: lxH:ilsa4] 

pthread create|&tid[i].NULL.thread, (woid *lil;: 

ARAE T, RES S EB ЖЫ F int ЖШ, ЖЕКА myid: 

inb myid = (ілі) vargpr 

B， 优 点 是 它 通过 消除 对 malloc 和 free (B. EHE T HB. ОАА О, НЕНЕН 
至 少 和 int 一 样 大 ， 即 恒 这 种 盆 设 对 于 所 有 的 现代 系统 来 说 都 为 真 ， 但 是 它 对 于 那些 过 去 草图 下 来 
Ik o т ар F N Г. 


4 5H 13.11 ЖЖ 
页， 原 蝗 的 程序 的 进度 图 好 图 13.43 所 示 。 
HF 2 





ШЕ 1343 — XEM PEIB i Е 
B. А {т} A Br 822 ШЕЛ ВОЗЕН, ВТЕ РА ОЕ. 
C. ATHERE. НЕОН ЕНЕДІ ЕСЕЙ. 
D. 正确 的 程序 的 进度 图 如 图 13.44 所 示 。 
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图 13.44 正确 的 无 死 锁 的 程序 的 进度 图 
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784 НЖА 


АЛ НСІ 参考 手册 


在 第 4 章 中 ， 我 们 用 НСІ, (Hardware Control Language， 和 硬件 控制 语言 )》 来 描述 了 几 种 处 理 器 
设计 的 控制 逻辑 部 分 ,HCL 具有 “ 些 硬 件 描述 语言 的 属性 , 允许 用 疡 描述 布尔 函数 和 学 级 选择 操作 。 
m— 8, КУР {ЕЕЕ НІМ, 中 能 找到 的 特性 ， 例 如 ， 声 明 寄 存 器 和 其 他 存储 元 素 的 方法 ， 
循环 和 条 恬 构 造 ， 模 块 定义 和 实例 化 的 能 力 ， 以 肥 位 提取 可 插入 操作 ， 

HCL 实际 上 只 是 一 种 语 言 ， 用 于 生成 疾 定 格式 的 蕊 代码 。HCL Xx ftri] Pre Sue X df 
HCL2C (表示 “HCL to C 转换 成 C 函数 。 然 后 再 编译 这 些 冰 数 ， 与 实现 其 他 模拟 器 肌 数 的 库 代 
码 链 接 ， 产 生 可 执行 模拟 程序 ， 如 下 图 所 小 : 


pipe-std.c 
pipe-std.hcl —-  hcl2c 


模拟 器 库 蝴 数 
rty.a 






пят РАЗД ЗЕ 


pipe tty 


这 张 图 展示 的 文件 被 用 来 生成 流水 线 模拟 器 的 文本 版 本 。 

可 以 直接 用 C 米 措 述 控制 逻辑 的 行为 ， 而 不 必 写 HCL， 然 后 再 翻译 成 C。 使 用 HCL 的 优点 是 
我 们 可 以 果 清 晰 地 区 分 硬件 的 功能 和 模拟 器 的 内 部 工作 方式 。 

HCL ҰНЫ 5257. bool (表示 “布尔 ”) 信号 要 么 是 0, EAE 1， 而 Ст “ЕЖ 
信和 号 等 价 于 心中 的 int 值 。 数据 类 型 int 用 于 家 水 所 有 的 名 位 信号 类 型 ,例如 ， 字 、 寄 存 器 到 和 指令 
代 公 。 当 转换 成 C 时 ， 这 两 种 数 突 类 型 都 表示 为 int 数据 ， 只 不 过 bool 类 型 的 值 只 能 等 于 0 或 者 1， 


АЛЛА BSAA 

HCL 中 的 表达 式 咏 以 引用 整数 或 者 市 水 类 型 的 命名 信和 叶 .。 信和 号 名 必须 以 宝 母 (a 一 z E AZ) 
开头 ， 后 面 可 以 是 任意 数 基 的 字母 、 数 字 或 者 下 划 线 (_)。 信 和 号 名 是 大 小 写 敏 感 的 。HCL ARAY 
煞 表 达 式 中 的 布尔 和 整数 信号 名 实际 上 就 是 C 表达 式 的 别名 .信和 号 的 声明 也 定义 了 相关 的 C i д. 
舍 号 声明 果 以 其 有 如 下 形式 中 的 一 种 

boolsig name C-expr 

intsig name 'C-expr' 

这 里 ，C-expr 可 以 是 任意 的 C 表达 式 ， 除 了 它 不 能 包含 单 引 号 《') 成 者 换行 等 Са) 以 外 ， 
SPA: c 代码 时 ，HCL2C = ААЛ С 表达 式 替 换 所 有 的 信号 名 。 
A.1.2 引号 引起 来 的 文本 

引号 引起 来 的 文本 提供 了 一 种 从 HCL2C 直接 传递 文本 到 生成 的 С 文件 的 机 制 。 可 以 用 它 来 插 
А418 31. include 语 介 ， 以 及 其 他 一 些 通常 能 在 C 文件 中 发 现 的 东西 。 通 用 格式 为 

quote ‘Siring' 


这 里 string 可 以 是 任何 不 包含 音 引 号 C) 或 者 换行 符 (n) 的 字符 串 。 
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A.1.3 表达 式 和 块 

有 两 种 类 型 的 表达 式 ， 布 尔 表 达 式 和 整数 表达 忒 ， 在 我 们 的 语法 描述 中 分 别称 为 hool-expt 和 
inexpr. 图 A.1 列 出 了 不 同 的 布尔 表达 式 类 型 。 按 照 优 先 级 的 降序 排列 ， 同 一 组 (组 与 组 之 间 由 水 
平 线 分 隔 ) 内 的 江 作 共有 相等 的 优先 级 。 可 以 用 括号 来 改变 普通 的 操作 符 优先 级 。 

最 高 级 是 常数 值 0 和 1， 世 及 命名 的 布尔 信 生 。 优 先 级 低 一 级 的 是 以 整数 为 参数 但 是 得 天 布尔 
结果 的 表达 式 。 集 合成 员 关 系 汕 试 将 第 一 个 整数 表达 式 int-expr 的 值 与 组 成 集合 的 每 个 整数 表达 式 
НЕ {intexpr, іші-ехртұ НК, АНАКИНА, ЖЕНА. ХАНЫМЫ ЕЕ 
式 ， 当 关系 满足 时 ， 产 先 1， 当 关系 本 满足 对， 产生 0。 


ЖЕНК0 

{А 1 

ін ema a 
іңі-ехрғ in linr-expry int-exprs, ==, int-expril 集合 成 员 关 系 测试 
int-expr, == ini-exprs Tap AR 
int-expr, I= ті-ехрға 不 等 测试 


ini-expr; < int-expra ДАЕ 15 
inf-expr, <= int-exprz 小 于 成 等 于 测试 
Ini-expr, > int-expra 大 二 测试 
int-expr >= ini-exprs AJ UEM pA 


bool expr 


booi-expr, && booi-expra And 


НА)! НСІ 布尔 表达 过 
这 些 表 达 式 求 值 为 0 或 者 1。 操 件 是 按照 优先 级 的 降序 排列 的 ， 每 “组 内 的 操作 具有 相等 的 优先 级 ， 
ЯЙ A.] 中 剩 下 的 表达 式 是 由 使 用 布尔 连接 符 的 公式 组 成 的 《! 表 示 Мо. RARR And, WIER 
Or). 
К-т ЕН KAK K: Zr. ап ЖЕГЕ SATEN (сае) ЖЕЛ. WFE V) FE 


AES. GAAN. MARERA ЕТЕ НИН ИГИ SL AS — ERU ӘЛІШ. Ы АН ТШ 
的 一 般 形 式 : 


[ 





bool-expr, : inrexpr, 
bool-expr, : int-expr; 


bool-expr, : int-expr, 
] 


表达 式 包 含 -系列 情况 ， 每 种 情况 i iH — PR EER bool-expr, 和 - ' 个 整数 表达 式 int-expr 
组 成 ， 齐 者 表明 是 否 沪 选 拌 这 种 情况 ， 而 后 着 是 对 于 这 种 情况 得 到 的 值 。 在 对 一 个 倩 况 表达 式 求情 
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村， 布尔 表达 式 是 按照 顺序 被 求 值 的 。 一 旦 有 一 个 布尔 表达 式 得 到 1, НАМАК ЈА НИЕ 
就 作为 情 枫 表 这 式 的 但 被 退回 。 如 果 没 有 布尔 表达 式 求 值 为 1， 那 到 这 个 情况 表达 芭 的 恰 就 为 0, 一 
个 好 的 纲 程 习惯 是 让 最 后 -个 布尔 表达 式 为 1， 以 保证 全 少 有 一 个 此 了 配 的 情况 ， 

HCL 表 站 式 梓 用 来 定义 组 合 运 辑 块 的 行为 。 所 的 定义 有 以 下 形式 之 一 : 

bool nathe = bool-expr; 

int nome = int-expr, 

АН, Жс УМЕН, mA FE X BE ИЙ. GE P—T SHADE name 为 名 
字 的 块 ，HCL2C 产生 一 个 函数 gen_name。 这 个 国 数 没有 参数 ， 而 它 返 同一 个 int 类 型 的 结果 。 
А14 НС! 示例 

下 而 这 个 示 枫 给 出 了 一 个 完整 的 HCL 文件 ， 用 HCL2C 处 理 它 得 到 的 5 代码 是 完全 日 包含 的 。 
可 以 颖 评 这 个 代 妈 ， 并 带 上 老 示 输入 信号 的 命令 行 参数 运行 它 。 更 加 典型 的 情况 是 ，HCL 文件 只 定 
义 模拟 模型 的 控制 部 分 。 然 后 生成 出 来 的 C 代码 被 编译 ， 并 与 其 他 代码 链接 ， 形 成 中 执行 模拟 器 。 
我 们 民 示 这 个 示例 只 是 为 了 给 出 HCL 的 一 个 具体 的 例子 。 该 电路 是 基于 4.2.4 节 中 描述 的 MUX4 电 


路 的 ， 其 结构 如 下 : 
51 

D 

C MUX4 Cut4 

B 

А 
1 ## Simple example of ап HCL file. 
à ** This file can be converted to C using hcl2c, and then compiled. 
3 
4 ЯҒ In this example, we will generate the МОХА circuit shown in 
5 ## Section 4.2.4. It consists of a control block that generates 
Б ## bit-level signals sl and st from the input signal code, 
了 ## and Lhen uses these signals tc control a 4-way muitiplexor 
3 ## with data inputs A, B, C, and D. 
3 
10 Яғ This code is embedded in a C program that reads 
11 ## the values of code, А, B, C, and D from the command line 
12 ## anc then prints -he circuit output 
13 
14 t$ Information that is inserted verbatim into the C file 
15 quote 'g$include «stdio.h»' 
lé quote '£include «stdlib.hs' 
i? quote ‘int code val, s(ü val, sl wal;' 


quote 'char **data names;" 


= =e 
шо 
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20 #4 Declarations oí signals used in the НСІ description and 
21 #4 the corresponding C expressions. 

22 boolsig sÜ “зд val' 

23  boolsia 51 "81 val' 

21  intsig code 'code val' 

25  intsig A 'atoií(data names[0])' 

26 | intsig B 'atoiídata, names[1])' 

27  intsig C 'atoi(data namesi2]!' 

a8  intsig D 

29 

30 #f НСІ descriptions of the logic blocks 
31 bool sl = code in ( 2, 3 1; 


'atoií(data names[3]!' 


32 

i3 bool 50 = code in [ 1, 3 }; 

34 

35 int Qut4 = ù 

i6 !в1 &k 1580 : А; # 00 

37 іи : B: 4 01 

i8 81 && 'sÜ C: 8 10 

ig i D; # 11 

40 1; 

41 

42 ## More information inserted verbatim into the C code to 
43 ## compute the values and print the output 
44 quote 'int main([int ағас, char *argv[]) {' 


45 quote 'data names = argv+2; ' 

46 quote 'code val = atoi(argv[1]);' 

17 quote 'sl val = gen si();' 

48 quote "50 val = пеп SHE 

49 quote 'printf('Out = td'in", gen Out4());' 
50 quote 'return 0;' 

51 quote ')j' 


XX ЖЇЗ КАТАЛ S S0 161, 以 及 整数 信 身 code, 作为 对 全 局 变量 s0 чаі. 51 уа! ЖІсоде val 
引用 的 兰 名 。 它 还 声明 了 整数 信号 A. B. C 和 卫 ， 这 里 ， 相 应 的 C 表达 式 对 于 作为 命令 行 参 数 传 
ЖЖ ЕМ ЕШ Ж atoi。 

名 字 为 8] КЕЛ ЕРСК C 代码 ; 

int gen slí) 

{ 

return {{соде val) == 2|licode val) == 3); 

] 

从 这 里 可 以 看 出 ， 集 合成 员 关 系 油 试 是 以 一 系列 的 比较 来 实现 的 ,每 次 对 信和 号 code 的 引用 都 被 
替换 成 了 C RIAA code val. 
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HA 





注意 , 这 个 HCL 文件 第 23 行 上 声明 的 信号 si 与 第 31 行 上 声明 的 名 为 s1 的 块 之 间 没 有 直接 的 


A. 


“Е С 表达 式 的 别名 ， 而 男 一 个 产生 名 为 gen 51 的 函数 。 


RAR S s RORIS A PE PAL E SN AG 


int mainíint атас, char *arav[]) í 


} 


data, names = argv+2; 

code val = atoilarav[1]); 

81 val = gen sl(); 

Өй val = gen, 6501): 

printfí"Out = $dn", gen OuL4(1); 
return 0; 


CERRADA LE Ж деп s1. gen 50 ЛІ gen Out4. ІХ ЕРЕК ЖЕНЕ XB. 我们 还 可 以 看 
出 C ARR ZR n fu Y Ok BUR ЕНЕ, 这 些 被 设置 的 值 被 用 在 表示 不同 信号 值 的 C 表达 式 


中 。 


---------------------------- 


D E ~ oce in gg Аш BR p 


BR) DO C3 BO М Ep к a e e мє к = — Ы 
Ыыз ә b p ©з Mw UD 23 бз ап ou Із B5 — rn 


i—— s 


code/arcl/seq/seg-std. Ас! 

TRETHSEESHEEURTEEESERSHSAHIHHSTERHUHSHARAEURATRSASHERUZSSÓAHERESHESEZSHESAISERSES 
i HCL Description of Control for Single Cycle Y86 Processor SEQ # 
+ Copyrigh- (C) Randal E, Bryant, David R. O'Hallaron, 2002 # 
EESE EEEE ЕЕ ИНН ЕНИН ЕЕН ЕНЕН НЕНЕН НЕНИН EE ЕНЕН 


ЕЕ ЕЕГЕЕЕГЕКЕЕЕҮ ЕЕЕ КЕЕ Иа ЫННЫН тннИИВРВИРЫНЫҢ ИЯНННҢНН 
# C Include's. Dcn't alter these # 
вне ЕН НЕН КЕН ЕН ЕЕЕ ЕНЕН ЫНЫ ЕН ЕЕ НЕНЕН НЕ 


quote 'finclude «stdio.bs' 

quote '£include "isa.h"' 

quote '#include "zsim.h"' 

quote 'int sim таіп(іпі ағас, char *argv[]);' 
quote 'int gen pcí)[íreturn 0;!' 

quote 'inL mainí(int ағас, char *argv[])' 

quote ' iplusmode-Ü;return sim main(argc,argv);)' 


НН AEE H EE EEEE ЕЕН ЕНЕННННИНИНННННННННННННННННННННННННННННННННННННЯЕ 
# Declarations. 20 not change/remove/delete any of these it 
НННИНИНИНИНННИННННННИНИНИННЕНИНИНИИВИНННИНИННИНИННИНИННИННИНИННИННЕНН 4% 


HEH Symbolic representation of Y86 Instruction Codes HE HE EE A E E V E 
intsig INO? 'I NOP' 
intsig IHALT ' Y HALT' 


处 理 器 控制 逐 辑 的 HCL 描述 789 


intsig IRRVOVL “Т КЕМОУТ, 
intsig IIREOVL "І IEMOVL!' 
intsig IRMMOVL 'i RMMOVL' 
intazig :MRMOVL ' IL MEMOVL' 
intsig IOPL "І ALU' 
intsidg L1JXX 'I JMP' 
intsig ICALL '1 CALL' 
intsiq TRET "1 BET' 


intsig IPUSHL 'I PUSHL' 
intsig IPOPL  'I POPL' 


ІН Symbolic representation of YB6 Registers referenced explicitly #### 


intsiq RESP 'REG ESF' % Stack Pointer 

intsig RNONE “ЕС МОМЕ! # Special value indicating "no register" 
ЕВН ALU Functions referenced explicitly HHRHH 
intsig ALUADD 'A ADD: # ALU sbould add its arguments 


ER Signals that can be referenced by control logic #####4## HERE E EEG 


ЕРЕН Fetch stage inputs ян 
iatsig pc 'pc' # Program counter 
НЕЕ. Fetch stage computations HEHHE 


intsig val 'valc' Corstant from instruction 


intsig icode 'icode' # Instruction control code 
intsig ilun "'ifun' # Instruction function 
intgiqg rA 'rà' Е rà [ieid from instruction 
intgsig rB гр" # rB field irom instruction 
# 
# 


intsig valP 'valp' Address of foliowing instruction 
ӨНЕ Decode Stage computations iis 

intsig ма1А 'vala' # Value from register А port 
intsig valB '" valb' # Value from register B port 


БЕЗІН Execute stage computations ##RH+ 


intsig valE 'vale' % Value computed by АШ 
boolsig Bch 'bcond' 4 Branch test 


ЖЕН Memory sLage computations ӘННЕН 
Intsig valM 'valm' * Value read from memory 


ЕНННЕНИНИИНИНИНИНИНЕНИНИНИНН ИЗ НИНИННИНИНННННИННН ІИНЕНИНБИННИНИНИНННИНИИН 
3 Control Signal Definitions. # 


ТЕЗ ЕНИНННИННННИЯНИНИНИНИНИННННИННИННИНИНИНИННИННИННИННИНИННИНИНННИННННННҢ 


790 RA 


70 

710 ФННИНННИННИНИНЯН Fetch Stage ИНИНИНИИНИННИННИННИНИНИНИНИНИНННЕННИННЕНІНННЕН 
72 

73 # Does fetched instruction require a regid byte? 

74 bool need regids = 

75 icode іп 1 IRRMOVL, IOPL, IPUSHL, ІРОРІ, 

T6 IIRMOVL, IRMMOVL, IMRMOVL 1; 

ТТ 


78 # Does fetched instruction require a constant word? 
79 bool need valc = 


BU icode іп { IIRMOVL, IRMMOVL, IMRMOVL, IJXX, ICALL }; 
B1 

82 bool instr, valid = icode in 

82 ( INOP, ТНАІТ, IRRMOVL, IIRMOVL, IRMMOVL, IMRMOVL, 
Ba IOPL, lJXX, ICALL, IRET, IPUSHL, IPOPL 1; 

Bh 


B6 ЕНННИНИНИННЯНЯ Decode Stage ЖННИИИНИНИНИНИНННИНИННИННИНИНИННЕННН 
87 


88 ## What register should be used as the A source? 
Rg int srcA = | 


90 icode іп | IRRMOVL, IRMMOVL, ТОРІ, IPUSHL } : га; 
31 icode in [ IPOPL, IRET } : RESP; 

92 1 : ЕҚОМЕ; # Don't neec register 

93 1; 

94 


95 ЯН What register should be used as the B sovirce? 
96 int srcB = [ 


97 icode in { IOPL, IRMMOVL, IMRMOVL ) : rB; 

98 icode in ( IPUSHL, IPOPL, ICALL, IRET 1 ; RESP; 
99 1 : RNCNE; # Don't need register 

100 1; 

101 


102 ## What register should be used as the E destination? 
103 int dstE = | 


104 icode іп [ IRRMOVL, IIRMOVL, ТОР} : rB: 

105 1сойе іп { IPUSHL, IPOPL, ICALL, IRET 1 : RESE; 
106 1 : RNONE; # Don't need register 

10) ] ; 

105 


103 Яғ What register should be used as the M destination? 
111 int dstM = | 


111 1соде in ( IMRMOVL, IPOPL } : rA: 
112 1 : RNONE; # Don't need register 
113 |; 


114 


„15 
216 
117 
118 
119 
120 
121 
122 
123 
124 
125 
126 
127 
128 
129 
130 
131 
132 
13i 
134 
135 
136 
137 
138 
139 
140 
141 
142 
143 
144 
145 
146 
147 
148 
149 

50 
151 
152 
153 
154 
155 
156 
157 
158 
159 
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БЕННННННЕНЕНІНЕ Execute stage ЁТЕ КЕНЕ Н НЕЕ ЕЕ HE H IE TE НАТ ЕЯ 


## Select input А to ALU 
int а1мА = | 
icode in ( IRRMOVL, IOPL ) : valA; 
icode іп { IIRMOVL, IRMMOVL, IMRMOVL ] : val; 
icode in { ICALL, IPUSHL К; -4; 
icode іп 1 IRET, IFPOPL } : 4; 
* Other instructions don't need ALU 


Ін 


## Select input B to ALU 
iut a.uB = | 
iecode in 1 IRMMOVL, IMRMCVL, IOPL, ІСАД,, 
IPUSEL, IRET, IPOPL ) : valB; 
icode in { IRKMOVL, IIRMOVE 1 : 0; 
# Other instructions don't need АШ) 


1; 


## Set rhe ALU function 
int alufun - [ 
icode == ТОРГ : ifun; 
1 : ALUADD: 
1; 


## Should the condition codes be updated? 


bool set cc = icode іп { ТОР |; 


ЧЕТИНЕ НЕННЕ Е Memory Stage НННННННИНИНИНИНИНИНИНИНИНИНИННИННННЯ 


## Set read control signal 
bool mem read = icode in ( IMRMOVL, IPOPL, IRET 1; 


## Set write conirol signal 
bool mem write = icode in | IRMMOVL, IPLSHL, ICALL ); 


ЯҒ Select memory address 

int mem addr = | 
icode іп { IRMMOVL, IPUSHL, ICALL, IMRMOVL ) : valE; 
icode in | :POPL, IRET } : valà; 
# Other instructions don't need address 


1; 


яғ Select memory input data 
int mem data - [ 
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150 # Value from register 
181 icode іп ( IRMMOVL, IPUSHL ] : valà; 
162 # Return PC 
163 icode == ICALL : valP; 
163 # Default: Don't write anything 
165  ]; 
166 
167 ОҢ ОЯЫНЫ ТЕРЕН Program Counter Update $AH iH pf HEA i i aE d A i ii A R H НЯНИ 
168 
169 ## What address should instruction be fetched at 
170 
17] int пем pe = | 
172 # Call. Use instruction constant 
173 ісейе == ICALL : ҹаіс; 
174 # Taken branch, Use instruction constant 
175 icode == IJXX && Bch : valt; 
176 # Comple-ion of RET instruction. Use value from stack 
177 icode == IRET : valM: 
178 # Default: Use incremented РС 
179 l : valP; 
180 |; 
一 -一 一 一 code/arch/seq/seq-std.hcl 
А.З SEQ+ 
— code/arch/seg/seg+-std.hcl 
1 ЕЕЕ PURSSSESUTRHANHEHHUSHESSXSUHESEASESHTEASESHHEHUHSSATHHRER HS d 
2 # HCL Description о: Control for Single Cycle Y86565 Processor SEQ+ # 
3 * Copyrigrt (С) Randal E. Bryant, рауіс R. O'Hallaron, 2002 # 
4 AAAA ЕЕЕ ЕЕЕ EE EEEE ЕЕЕ КЕЕ ИИН Ы Е ЖЕКЕ ЖЕ ЕЕЕ ЕЕ EEE E. 
5 
Б БЕЕК ЕЕЕ ЕЕЕ ЕЕЕ НИНИИНИНИНИННЕНИНИНЕННИНННЕНИНЕИННИНЕНИНЕЕЕЗІ 
7 Ё C Include's. Don't alter these # 
8 ЕЕЕ ЕЕ ЕЕЕ ЕЕЕ ЕЕ ЕЕЕ КЕ ЖЕЕ-Е К ЖОКЕ ЖКК ЕЕЕ ЕЕЕ Ы НЕ НЫ НЫН ІНІНЕН 
9 
10 quote '#include «stdio.h»' 
11 quote '&include "isa.h"' 
12 quote 'sinclude "sim.h"' 
13 quote 'int sim main(int argc, char *argwv.]);' 
14 quote 'int деп new pcilíreturn 0; ' 
15 quote 'int main[int агас, char *argví])' 
16 quote ' ([plusmode-l;return sim main(argc,arqv):]' 
17 
18 


твентв  ЕЕННИННИНИННННИНИНИНИНИНИИНИННИИИИНИЯ ИНИНЯИННННЕННННыНН 


19 
20 
21 
22 
23 
24 
2n 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
35 
37 
38 
39 
40 
4] 


4 
a 


45 
44 

5 
AC 
47 
48 
49 
56 
51 
52 
53 
54 
55 
56 
57 
58 
59 
50 
61 
62 
63 


# 
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Declarations. Do nob change/remove/delete any of these ф 


ННИНИННИНИННИНИНИНИНИНИНЕНЕННИННННИНЕИНИНИННИННИНИНИННИНИНИНН EEEE EEEE EEE EE 


БЫНЫ Symbolic 


representation of YES Instructior Codes ШМННННННННЗ 


intsig ІМОР "І NOP' 
intsig IHALT 'I HALT' 
int&ig IRRMOVL СІ RRMOVL' 
intsic IIRMOVL  'I IRMQVL' 
іпівіс IRMMOVL  'I, RMMOVL' 
intsig IMRMOVL  'I MEMOVL' 
intsig IOPL 'I ALU' 
intsig IJXX "i JMPE' 
intsig ICALL "I CALL' 
intsig IRET "І КЕТ! 
intsig iPUSHL *1 PUSEL' 
intsig IPOPL І POPRL' 


##### Symbolic representation of YB6 Registers relierenced explicitly $334 
intsiq RESP 
intsiq RNONE 


##### SLU Functions referenced explicitly 


intsig ALUADD 


"КЕС ESP' 
"КЕС NONE ' 


# Stack Pointer 
* Special value in&icating "no register" 


HHRHH 


'A ADD' # ALU should add its arguments 


ян Signals that can be referenced by control logic BEHSES RSE SUE REE RE Sd E E 


f4dR3 PC stage inputs 


Ë + h W h 


ЕР All of these values are based on those from previous instructior 


intaig plcode 'prev icode' 


t Instr. control cade 


intsig pValC 'prev valc' # Corstant from instruction 
intsig pValM 'prev, valm' * Value read from memory 
intsig pValP 'prev valp' # Incremented program counter 


boolsig pBch 


'prev bcond' 


* Branch taken flag 


ЕНІН Fetch stage computations HEHHE 

intsig icode 'icede' # Instruction control code 

intsig ifun 'ifun' % Instruction function 

intsig ГА 'ra' * ГА Field from instruction 
intsig rB 'rb' # ГЕ field from instruction 
incsing valg 'valc' * Constant from instruction 
intsig valP 'valp' # Address of fo lowing instruction 


Ё##Ё# Decode stage 
intsig valÀ 'vala' 


computations best 


# Value from register А port 
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64 
55 
66 
67 
68 
69 
70 
71 
72 
73 
74 
75 
76 
77 
78 
79 
80 
81 
82 
83 
84 
85 
86 
87 
88 
89 
90 
91 
92 
93 
94 
95 
96 
97 
98 
99 
102 
101 
102 
103 
104 
105 
106 
107 
108 


HRA 


intsig valB 'valb' # Value from register B port 


ЕНІН, Execute stace computations ЕН 


intsig valE 'vale' # Value computed Бү АШ 
рооіѕ1ч Bech 'bcond' # Branch test 

##### Memory stage computations ЕЕЕ 

intsig valM 'valm' # Value read from memory 


НЕННЕ НЕННЕ НЕНЕН НЕЕ E E R A E E ЕЕ НИНЕН E E EE HEA E EHE EE E HE AE EA E ЕЕН E ЕНІНЕН 
# Control Signal Definitions. # 
ҤЕ ЕНИН E НИНИНИНИННЕННННИНИНИНИННИННИНИНИНИНЕНЕНННЕЕНЗ 


БННЕИННИНННННЯНЕ Program Counter Computation ІННЕННИНННИННИНИННИННН? 


% Compute fetch location for this instruction based on results from 
t previous instruction. 


int pe = | 
# Call. Use instruction constant 
picode == ICALL : pValC^; 
* Taken branch. Use instruction constant 
plcode == IJXX && pBch : pValc; 
# Completion of RET instruction. Use value from stack 
pIcode == IRET : pValM; 
# Default: Use incremented PC 
1 : pValP; 
|1; 


НИННИННИННИЕНННЯ Fetch Stage # ++ ЖЕЕ ЕЕЕ ЕЛЕЕ ЕЕН ННН НЕЕ ЕЕЕ ЕЕ 


т Does fetchecó instruction require a regid byte? 
bool need гесійе = 
icode іп [ IRRMOVL, IOPL, IPUSHL, ÍPOEL, 
IIRMOVL, IRMMOVL, IMRMOVL ); 


* Does fetched instruction require a constant word? 
bool need valC = 


іссе in í IIRMOVL, IRMMOVL, IMRMOVL, IJXX, ICALL ): 


bool] instr valid - icode in 
i ІМОР, IHALT, IKRHMOVL, IIRMOVL, IRMMOVL, IMREMOVL, 
IGPL, АХХ, ICALO, IRET, IPUSHL, IPOPL }; 


109 
110 
111 
112 
113 
114 
115 
116 
117 
118 
119 
120 
121 
122 
123 
124 
125 
126 
127 
128 
123 
130 
131 
132 
13i 
134 
135 
136 
137 
138 
139 
140 
141 
142 
143 
144 
145 
146 
147 
148 
149 
153 
151 
152 
153 
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## ЕТЕНЕ #+#Е# Decode Stage Hist tbid t d E e d 


## What register should be used as the A source? 

int srcA = | 
icode in [ IRRMOVL, IREMOVL, ТОРІ, IPUSHL } : ға; 
icode in [ IPOPL, IRET ) : RESP; 
1 : RNONE; # Don't need register 

1; 


## What register should be used as the B source? 

irt srcB = | 
icode in { IOPL, IRMMOVL, IMRMOVL J : rB; 
icode in { IPUSHL, IPOPL, ICALL, IRET ) : RESP; 
1: RNONE; 4 Don't need register 

1; 


## What register sbhould be used as the E destination? 
int dstE - [ 
icode in 1 IRRMOVL, IIRMOVL, ТОРЫН : rE; 
icode in { IPUSHL, IPOPL, ICALL, IRET } : RESP; 
1 : RNONE; # Don't need register 
1: 


## What register should be used as the M destination? 
int dstM - [ 

icode in { IMRMOVL, IPOPL ) : rA; 

1: RNONE; % Don't need register 
Іі 
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TUFRSSERRUERUAERS Execute Stage МННИНИИИЯВНВНИИЯВ ИЯЕНИНИНИНИННИЯ 


## Select input А to ALU 
int aluà = | 
icode in { IRRMOVL, ТОР, + : valA; 
icode in 1 YIIRMOVL, IRMMOVL, IMRMOVL ) : valC; 
icode in | ICALL, iPUSHL ) : -4; 
icode in ( IRET, IPOPL } : 4; 


# Other :nstructions don'- need ALU 
1; 


## Select input B to АШ 
int aluB = | 
ісоде in ( IRMMOVL, IMRMOVL, IOPL, ICALL, 
IPUSHL, IRET, IPOPL ) : valB; 
icode in { IRRMOVL, IIRMOVL } : Q: 
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154 # Other instructions don't need АШ 
155 1; 
156 
157 ## set Lhe АШ function 
158 inr alufun = | 
159 jcode == ТОРЫ : ifun; 
160 1 : ALUADD; 
161 1; 
152 
163 ңғ Should the condition codes be updated? 
164 bool set, се = icode in ( ТОРЫ }; 
165 
166 ӘНЕ ЕНННННЕНННН Memory Stage ЖЯНННИНННИНИНИНИНИННИНИННИНИН ЫН 
187 
168 ## Set read control signal 
169 bool mem read = icode in { IMRMOVL, IFOPL, IRET ); 
170 
171 ## Set write cortrol signal 
172 bool mem write = icode іп { IRMMOVL, IPUSHL, ICAL, }; 
173 
174 ## Select memory address 
175 int mem addr - [ 
175 icode in { IRMMOVL, IPUSHL, ICALL, IMRMOVL ) : valE; 
177 1соае in 4 IPOPL, IRET } : valà; 
178 # Other instruztions don't need address 
179 1; 
180 
181 ## Select memory input data 
182 int mem data - [ 
183 # Value from ragister 
184 icode in { IRMMOVL, IPUSUL } : уа1А; 
185 # Return PC 
186 icode == ICALL : valE; 
197 # Defauit: Don't write anything 
188 |: 
--- code/arciseq/seq--std.hcl 
AA PIPE 
一 codefarcivpipe/pipe-std.hcl 
1 ПЕНЕН ЕНЕНЕ ЕНЕВ ВЕНЕВ ВЕЕ ННН НЕЕ НЕННЕ ЫНЫ 
2 # НСІ Description of Control for Pipelined Y86 Processor # 
3 % Copyright (С) Randal E. Bryant, David в, Q'Hallaron, 2002 # 
4 


НЕИННИННИННИНИНИННИННИНИНИНИННИНИНИНИННИННИНИНИНИНИНН НІНЕ НЕНИН 


ы ім 
[i 4 


шә de 
I> >à 


AE dum Hs HCL 描述 797 


PARAHA ВРИРИРЫЗ ЕР ЫТЫ ағ ЕР ЗІНЕ 
t C Include's. Don't alter these # 


FusSHRESRASRRSURUTETSESUHEESUESEERESEREERRSEHEESHESHSTESEUTABRSRETHEHRESSE 


quote 'H#include «stdico,.h»' 

quote '#include "isa.h"' 

quote 'tinclude "pipeline.h"' 

quote 's&include "stages.h"' 

quote 'sinclude "s:m,.h"' 

quote 'int sim main(int ағас, char *argv[]l):' 

quote 'int mainíint ағас, char *arqv[)) return sim mainí[argc,argv):]' 


ВЕТЕР ЕРЕН ЕТТЕ ЕЕЕ ЕЕЕ ЕНЕ ІНЕН ЕЕЕ ЕРІНІН 
# Declarations. Do not change/remove/delete any of these # 
ЕЕЕ ЕЕЕ ФАО МА ЫЫ ЕРТ ЕН ЕН НІНЕ 


FEES Symbolic -epresentation of Y86 Instruction Codes ағынын 
intsig INOP 'I NOP' 
intsig IHALT 'l HALT' 
intsig IRRMOVI, "I REMOVLE!' 
intsig IIRMOVL D IRMOVL' 
intsig IRMMOVL "І RMMOVL' 
intsig ІМВМОҮТ, ' I. МЕМОУТ,' 
intsig ТОР І ALU' 
intsig IJXX 'I TMP 
intsig ICALL ' I CALL' 
intsig IRET 'I RET' 
intsigd TEUSH, "І PBSHL' 
intsig ІРОРІ, 'T. POPE! 


fid Symbolic representation of Y86 Registers referenced explicicly ##### 
їпїв1д RESP "КЕС БӨРІ 4 Stack Pointer 
intsig RNONE "БЕС МОМЕ’ # Specialvalue indicating "no register" 


ТЕТЕ ALU Functions referenced explicitly итын гын 
іпізіс ALUADD "А ADD' # ALU should add its arguments 


НЕНІ Signals that can be referenced by control logic АТЕНЕ Е 
443449 Pipeline Register Е ЕКНЕЕЕЕРЕНЕННЕ ЕН ЕЕ НЕЧЕ НА НА Е ЕНЕ 
intsig F predPC pc curr-»pc' # Predicted value of PC 


ӘНЕ Intermediate Values in Fetch Stage  НРННИНИНННИННИН:ҒІНИНИНИ EE EE EHE GHI 
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50 
51 
52 
53 
54 
55 
56 
57 
58 
23 
60 
51 
62 
63 
64 
55 
66 
57 
68 
59 
79 
71 
72 
73 
14 
75 
Ш> 
7" 
7B 
79 
BÜ 
8l 
82 
83 
84 
85 
86 
87 
88 
89 
90 
91 
92 
93 
94 


intsig Ё icode 


intsiq 
intsiq 
intsig 


f, ifun 
f valcC 
f valFP 


MA 


'u£ id пехі->ісойе' # Fetched instruction code 


'if id next-»ifun' 
'if, id next-»valc' 
КІР 14 next-»valp' 


# Fetched instruction function 
# Constant data of fetLclied Lust ruction 
# Address of following instruction 


ЗЕЕ Pipeline Register D ЭИНИНИНИНІНЕЕІЕНЕНИННЕНЕЕІНИНЕЕЯЕЕЕНЕ 


intsig D icode 


intsig 
intsig 


D rÀ 
П ЕВ 


intsig D valP 


тіЕ id curr-2icode' # 
'if id curr-»ra' қ 
' if, id curr-»rb' H 


КІР ій curr-»valp' # 


Instruction code 

rà field from instruction 
rB field from instruction 
Incremented РС 


ЕЗІН Intermediate values in Decoce Stage ЖИНИНИНИЕНИНИННИНИННЕННЕН 


1пі 819 


d srca 


intsig d srcE 


intsig d rvalA 


'id ex next-»Srca' 
а ex,next-»srzb' 
"а regvaaia!' 


intsig d rvalB'd regvalb' # 


# srcA from decoded instruction 
# srcB from decoded instruction 
# valà read from register file 


valB read from register file 


ЕНІН Plpeline Regisseer E МНИНИЯЕВЯНВИНИНЕЕИНИННИЯ ЕЕЕ НИНЕ ННЯ 


intsig 
intsig 
intsig 
intsig 
intsig 
intsig 
intsiq 
intsig 
intsig 


E icode 
E ifun 
E valC 
E src 
E valA 
E ГСВ 
E valB 
E dstE 
E дБм 


'id ex curr-»icode' 
'id ex curr--»ifun' 
'jd ex curr-»valc' 
id ex curr--»srca' 


# 
# 
# 
қ 
ііі ex curr-»vala' # 
'id ex curr-»srcb' # 
'id, ex curr-»valb' Ё 
' id ех curr-»deste' # 

# 


'id ex сігг->йезіш! 


Instruction code 
Instruction function 
Constant data 
register ID 
value 
register IE 
value 


Source А 
Source À 
Source B 
Source H 
Destinaticn E register ID 
Destination M register ID 


ЕН Intermediate Values in Execute Stage ЕЕ ЕНЕ ЕЕ ЕНІНЕН 
intsiq е valE 'ex mem next--vale' 
baolsig e Bch "ех mem next-»takebranch' 


ВЕНН Pipeline Register M 


intsig M icode 


intsig 


M ifun 


intsig M valA 


intsig 
intsig 
intsig 


M <БЕК 
M valE 
M Сем 


boolsig M Bch 


ех mem curr--»icode' 

"ех mem curr-»ifun' 

"ах mem carr-»vala' 

"ех mem cirr-»deste' 

"ех ет curr-»vale' 

"ех mem curr--»destm' 

"ех mem curr-»takebranch' 


% valE generated by ALU 
# Am I about to branci? 


p dg 

& Instruction code 

# Instruction function 

# Source А value 

* Destination E register ID 
# АШ) E value 

k Destination M register `D 
* Branch Taken fiag 


FHER Intermediate Values in Memory Stage ФШИмннииИниниЕЕЕНИЯ НЫН 
intsig m valM “теп wb next-»valm' # 


valM generated by memory 


95 

95 

97 

98 

99 

100 
101 
102 
103 
104 
105 
105 
107 
108 
105 
110 
111 
112 
113 
114 
115 
116 
117 
118 
119 
120 
121 
122 
123 
124 
125 
126 
127 
124 
129 
130 
131 
132 
133 
134 
135 
135 
13" 
138 
139 
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ЯН Pipeline 3egisLer W ЖННИНИНИЕНИНННИНЕНЕИННИННННИЕЕЕЕЛЯЯЕЗЕ 

intsig W icode mem wb curr-»icode' t Instruction code 

intsig W dstE ‘мыд wb curr-»deste' # Destination E register ID 

intsig Ж valE “пеш wb curr--vale' # АІ) E value 

inrtsiq W dsetM ‘тет wb curr-»destm' š 
% 


intsig W valM 'mem wb curr-»valm' 


Destination M register ID 
Memory M value 


КЕДЕННЕН ТЕРА РЕНТА ТЕН ТІНЕН ЕНІН 
# Control Signal Definitions. # 
ЕНЕЕЕЕЕНЕЕІН ЕЕ ЕЕЕ ЕЕЕ КЕКЕ ЖЕЕ ЕЕЕ ЕЕЕ ЕНІН ЕНІН ЖЕ ЖЕГЕ ЖЕЕ Ж. 


ӘЗИЗ Fetch Stage ФНИРНИНННИИННИНИЯНИНННИНИНИЯ БЕЗІНЕН 


Я% What address shculd instruction be fetched at 
int f_pc = [ 
ñ Mispredicted branch. Fetch at incremented РС 
M icode == IJXX Ев ІМ Всһ : M, valA; 
% Completion of RET instruction. 
W icode == IRET : W маім; 
ft Default: Use predicted value of FC 
1l: Ё ргеарс; 
|; 


# Does fetched instruction require a regid byte? 
bool need regids - 
f icode іп { IRRMQVL, ТӨРІ, IPUSHL, IFOPL, 
IIRMOVL, IEMMOVL, IMRMOVL i; 


# Does fetched instruction require a constant word: 
bool need valC = 


t icode in 4 iiRMOVL, IRMMOVL, IMRMOVL, IJXX, ICALL ); 


bool instr valid = i icode in 
| INOP, IHALT, IRRMOVL, IIRBMOVL, IRMMOVL, IMRMOVL, 
iOPL, ТІЛАХ, ICALL, IRET, IPUSHL, IFCPL Jj; 


* Predict next value of PC 

int new F ргсарс = | 
І icode ir { IJXX, ICALL } : Ё valt: 
l : E valpb; 


НЕНЕН НЕЕ Decode Stage ЭНЕННИНИНИННИНИНИННИННИНИН НИНННИНН 
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140 
141 
142 
143 
144 
145 
146 
147 
148 
149 
150 
151 
152 
153 
154 
155 
156 
157 
158 
155 
160 
161 
164 
163 
164 
165 
166 
167 
168 
169 
170 
171 
172 
173 
174 
175 
175 
177 
178 
179 
180 
181 
182 
183 
184 


B XA 


## what register should be used as rhe А source? 


int new E srcà - | 


D icode in í IRRMOVL, IRMMOVL, ТОР, IFUSHL } : D та; 


D icode in ( IPOPL, 


IRET | 


RESP: 


1 : RNONE; # Lon't need register 


1; 


34 what register should be used as the B source? 


int new E srcB = | 
2 icode in і IOPL, 


IRMMOVL, 


D icode in 4 IPUSHL, IFPOPL, 
11 RNONE: # Don't need register 


1; 


IMRMOVL ) : D rB; 
ICALL, IRET ` : RESP; 


ЯЯ what register should be used as tte E destination? 


int new E dst* = [Í 


D icode іп { IRRHMFOVL, 


D icode іп 1 IPUSHL, ІРОРІ, 
1 : RNONE; # Don't need register 


IIRMCVL, IOPL) : D rB; 


ICALL, IRET } : RESP; 


ЕҢ What register should be used as the M destination? 


int new, E dstM - [ 

D icode in { IMRMOVL, IPOPL ) 
1 : RNONE; # Don't need regi 
l; 


D rå; 
ster 


ЕН What should be the A value? 
## Forward into decode stage for valA 


int new E valà = | 
D icode in { ICALL, 
d srcA == E dstE : 
d 5ҮСА == M dstM 
d srcAÀ == М dstE : 
d SrcA == W GstM ; 
d srcA == W CStE 


IJXX } 
e valk: 


: m valM; 


М valE: 
W valM; 
W valE; 


$ 
* 
# 
# 


# 


D valP; # Use incremented PC 
Forward valB from execute 
Forward valM from memory 
Forward valE from memory 
Forward valM from write back 
Forward valE from write bacx 


"10! d rvalà; Ж Use value read from register tile 


|; 


int new, E valB = [ 
d srcB == E dstE 
d srcB -- M dstM 
d SrcB == М dstE 


е уа1Е; 


: m, уа1м; 
: M valE; 


* Forward valE from execute 
* Forward valM from memory 
# Forward valE from memory 


185 
196 
187 
188 
189 
190 

191 
192 
193 
194 
195 
135 
197 
198 
199 
200 
201 

202 
293 
204 
425 
226 
207 
208 
209 
210 
211 
222 
223 
224 
215 
215 
217 
218 
219 
220 
221 
222 
223 
224 
425 
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d srcB == М dsetM : W valM; # Forward valM from write back 
d srcB == W dstE : W valE; # Forward valE from write Dack 


1 : do rvalB; % Use value read from register file 
l; 


ЖЕНЕВ НН Execute Stage HHA EHI A T HEH i fH HE HE E E Eu E E H SE HER E A EE E EE EF E TER 


ЯН Select input А to ALU 
int aiu = | 
E icode іп { IRRMOVL, IOPL } : E vali; 
E icode іп { IIRMOVL, -RMMOVL, IMRMOVL ] : E, valcC; 
E icode in í ICALL, IPUSHL ) : -4; 
E ісосе in { IRET, IPOPL } : 4; 
t Other instructions don't need АП] 


#{ Select input B to ALU 
int aluB = | 
E icode in ( IRMMOVL, IMRMOVL, ICPL, ICALL, 
IPUSHL, IRET, IFPOPL } : E valB; 
b icode in [ IRRMOVL, IIRMOVL ] : D; 
* Other instructions don't need ALU 


1; 


## Set the ALU function 

irt alufun = [ 
E icode == ISPL : E ifun; 
l : АПА; 

1; 


** Should the condition codes be updated? 
bool set cc = E icode == -OPL: 


НЕНЕН ЯЕ ЕНЕ Memory Stage ФИНРМНИНИНИИНИНИИНИНИНИНИНІНЫНЫНННН 


#g# Select memory address 
inz mem адаг = i 
M icode in í IRMMOVL, IPUSHL, ICALL, IM3MOVL ) : M valE; 
M icode in ( IPOPL, IRET ) : M valA; 
# Other instructions don't need address 


602 HRA 


226 ]; 

227 

228 #%# Set read control signal 

229 bool mem read = М icode іп 1 IMRMOVL, IPOPL, IRET }; 

230 

231 ## Set write control signal 

232 bool mem write = M icode іп í IRMMOVI, IPUSHL, ICALL 1; 

233 

234 

235 БЕЯЕНФТЯЕЕІНЕЯН Pipeline Register Control фФЯКЯННЯ Т ЕНЯЯ ЕЕЕ ЕЕЕ 
236 

237 # Should I stall or inject a bubble into Pipeline Register F? 
238 # AC most one of these can be true. 

235 bool F bubbie = 0; 

2460 booi F stall = 


241 # Conditions гог a load/use hazard 

242 E icode in ( IMHMOVL, IPOPL } && 

243 E dstM in í 4 srcA, d srcB 1 i| 

244 # Scalling at fetch while ret passes through pipeline 
245 IRET іп { D icode, E icode, M icode }; 

246 


247 # Should I stall or inject a bubble into Pipeline Register D? 
248 # At most ono of these can be trus. 
24% bool D stall = 


250 t Conditions for a load/use hazard 

25. E icode іп { IMRMOVL, IPOPL ) && 

252 E dstM in { d_srcA, d srcB 1); 

253 

254 bool D bubble = 

255 # Mispredicted branch 

255 E icode == IJXX && le Bech HI 

257 + Stalling at fetch while ret passes through pipeline 
258 IRET in 1 D icode, E icode, M icode ); 

25% 

260 # Should I stall or inject a bubble into Pipeline Register E? 
261 % АС most one of these сап be true. 


262 bool E stall = 0; 

263 bool E bubble - 

264 + Mispredictec branch 

265 [E icode == IJXX && .e Rchi || 

266 % Conditions for а load/use hazard 
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267 E icode іп í IM3MOVL, IPOSL } kk 
258 E detM in { d srcà, d srcB): 
269 


270 # Should 1 stall or inject a bubble into Ріреіз пе Register М? 
Ун # At most опе of these сап be true. 
272 hool M stall = 0; 
273 bool M bubbie = 0; 
——nTT T —-  cuode/arch/pipe/pipe-sid. hei 
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ti DAD BE 


BI Unix 系统 中 的 错误 处 理 
В2 ”错误 处 理 包 装 函 数 

83  csapph 头 文件 

В4 сѕарр.с 源 文件 


806 
808 
809 
813 
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Fa T I V 2 X: МАЛО, УРО Н, ПЕ 
Н Ec Se e НЕ ДИКАН MA REXEMOU TEASE BR. xS. AF IU AS RS НТ 
п, ЕДЕСА ЕВЕ К. Ж Че EM АУЕ АЈ. ШЕЮ éd 
ARAS Kiaka, МАТЕР o EA e Ик. 

在 编号 本 书 时 ， 我 们 面临 类 似 的 问题 。 方面， 我 们 希望 我 们 的 代码 示例 阅读 起 来 简洁 简单 ， 
尹 一 方向， 我 们 基 术 希望 给 学 牛 们 个 错误 的 印象 ， 以 为 可 以 省 略 错 误 检 查 。 为 了 解决 这 些 问 题 ， 
我 们 采用 了 一 种 基于 错误 处 理 包 荣 函 数 Cerror-handling wrapper? 的 方法 ,这 是 由 W. Richard Stevens 
在 他 的 网 络 编程 教材 [81] 中 最 先 提出 的 。 

上 其 忠 想 是 ， 给 定 菜 个 基本 的 系统 级 函数 Гоо. ТЕ АНА. КАМЕ А 
ТЫН Foo ӘИЕЛ. ЛЕН. ЕНСЕ Т Яна. WAERT 
D fud. ЖЕГИ. ЖШ, ЕЗЕРА НА. EB, КЕЯ, б АИ КИТ ЖЖ 
Мл Е. Желі, ЖЕНЛИЯНЕ RARO Fih, AEA LH RET GUERRE E “2. 
苹 小 号 并 重新 网 译 ， 也 能 正确 这 行 。 

Ек ЖОК ЛЕЛЕ 个 源 文 件 Ссѕарр.с) 中 ， 这 个 文件 被 编 详 和 链接 到 每 个 程序 中 ， 一 个 独立 
的 头 文 件 《csapp.h) 中 和 包含 这 些 包装 时 数 的 函数 原型 。 

Жкн TARF Unix 系统 咎 不同 种 类 的 错误 处 理 的 指南 , 运 给 出 了 不 同 风格 钓 错误 处 理 
色 沪 阴 数 的 示例 。 为 了 方便 参考 ， 我 们 还 包括 了 csapp.h 和 сѕарр.с ЗК. 


B.1 Unix 系统 中 的 错误 处 理 


本 书 中 我 们 选 玫 的 系统 级 函数 调用 使 用 .种 不 加 风格 的 返回 错误 Unix 风格 的 、Posix 风格 的 
和 DNS 风格 的 。 


Unix 风格 的 稍 误 处 理 

像 fork 和 wait 这 样 Unix 早期 开发 出 来 的 靖 数 (以 及 一 些 较 老 的 Posi KAO МИЫН ІН 
BEREIT, EBEN. Dan. "t Unix KU TI wait PROBES] :个 错误 【例如 没有 了 进 
ны), ЕЙАМ-І, PETREA ermo 设置 为 指明 错误 原 内 能 错误 代码 。 如 果 wait 成 功 完 
成 ， 那 么 它 识 返 回 有 上 州 的 结果 ， 也 就 蚌 思 收 的 子 进 称 的 PID。Unix 风格 的 错误 处 理 代码 通 带 且 有 以 
FEX: 

1 if ((pgid = walt(NULL)) < 0} 1 

2 [fprintfistderr, "wait error: %в\п", strerror(errno]]: 

3 exit(0); 

4 } 


strerror ARA [B] E ermo {ЙТ Ж ^ $835. 


Posix 风格 的 错误 处 理 

ТЕЗ ah bJ Posix 函数 ， 例 如 Pthread Ей. Н.Ж Iu (ee UB (0) HX CURIE CAE OD, {Т 
fa 8 FI їн ЖАБЫ] Ей E МЕЛ ЖНЖ Mer, 我 们 称 这 种 方法 为 Posix 风格 的 错误 处 理 。 
例如 ，Posix 风格 的 pthread_create ñ $£ R] z ШЕБИН ЖЕЕ ЫЛЫ КОК. ПОГОН ЙИ 
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线程 的 ID (AHRI 返回 放 在 它 的 第 - -个 参数 中 。Posix MERR UR AERE GUB HUE FFE 
A 


l ii ((retcode = pthread create(&tid, NULL, thread, NULLI} != 0б) 1 

2 fprintfístderr, "pthread create error: $s'*n", strerroríretcode,); 
3 ех1ї:0); 

4 j 

DNS 风格 的 错误 处 理 


gethosibyname 和 gethostbyaddr HARR DNS i 域名 系统 ) 主机 条 日， 它们 有 男 外 一 种 返回 错 
WII. 这些 函 数 在 和 失败 时 返回 NULL RH, RRCA hemo, DNS 风格 的 错误 处 民 通 
Ж BU F ЖА: 


1 if (ip = gethostbynamei(name)] } == NULL) { 


2 fprintfístderr, '"gqethostbyname error: к\п", hstrerrorí(h errnol]; 
E ех1[ 10); 

4 } 

错误 报告 前 数 小 结 


册 罕 本 书 ， 我 们 使 用 下 列 错误 报告 明 数 来 包容 不 同 的 错误 处 理 风 格 ; 


tinclude "csapp.n" 


void unix error!char *msg): 


void posix error[int code, char *msc); 
void dns error(char *msa; 
void app _еггог(сһаг *msdl; 





ЕЖЕ ПЕ} а E EBR KEE, unix error. posix error 和 dns. error 函数 报告 Unix 风格 的 错 庶 、 
Posix ДАЖЕ ИН ЮМ DURER. AEE. app eror AKE T h dS HE ERR. CRE 
简单 地 打印 它 的 输入 ， 然 后 终止 。 网 B.1 Ios TAER R or n ein 


---- 一 一 一 ”一 一 一 一 





code/sre/esapp.c 
void unix еггогісһаг *msg) /*unix-style error */ 

Í 

fprintfí(stderr, "%с: Ұнап", msg, strerrorí(errnol]; 

вхіі {0}; 


void posix erroríint code, char *msg) /* posix-style error */ 
[ 


шы cO — Ce (Hou LO Мм LE 
— 


tprintistderr, "$s: %ш\п", msg, strerrorícede)j]; 
14 exitii); 


13 void dns_errorichar *mnsg; /* dns-style error */ 
14 { 


808 ШЖ В 





15 fprintt(stderr, "$s: DNS error d\n", msg, h errno); 
16 exití(0); 

17 ) 

18 

19 void app error(char *msg} /* application error */ 

20 ( 

21 fprintfistderr, "%sxn", mag): 

22 ехі {0}; 

23 } 





code/sre/csapp.c 








code/src/csapp.c 
pid t Waitíint *status! 
i 

pid t pid; 


1f (ipid = waiz(status)) < 0) 
unix errorí("Wait error"]; 
return pid; 





— code/src/cCsapp.c 
图 B.2 Unix 风格 的 wait Ар 


B. манын 
F 8 — b [| ЛАН АН: 
Unix 风格 的 错误 人 处理 包装 而 数 


图 B.2 展示 了 Unix 风格 的 wait ЖЕЛЕРІ. WE wait 返回 一 个 错误 ， 包 装 硼 笋 打印 一 条 
消 司 ， 然 后 退出 。 否 则 ， 它 问 调 用 者 返回 一 个 PID。 


图 B.3 展示 了 Unix 风格 的 kill 隙 数 的 包装 硝 数 ,注意 , 这 个 范 数 同 wait 不 同 , ШІН void. 








OO code/src/csapp.c 
1 void Killipid,t pid, int signum! 
2 { 
3 inL rc; 
4 
5 if ((rc = killipid, sigrum)) < 0) 
б unix error("Kill error"); 
? | 
code/sre/csapp.c 





BIB. Unix ДҮ ҢҮ kill МЕНЕН 


на 


Posix АНУАР ЕН 
ЕВДЕЖЛІ Posix 风格 的 pthread, detach AAKER AS. ЫАЖ Posix MARAR Е, 
CARRETERAS ИНЕК Ж, BELLUM, ORIS SORIS! void. 


void Pthread detachi(pthread t tid! 1 
int rc; 


if {irc = pthreaà detachítid))» != 0j 
posix errorí(rc, "Pthread detach error"); 


图 B.4 Posix 风格 的 Pthread detach 函数 的 包装 函数 


DNS 风格 的 错 其 处 理 包 装 图 数 
图 В.5 展示 了 DNS 风 档 的 gethostbyname ШЕБІ ЗЕРЕ. 


с мы oa ug amoLo b Lr 


00 
с 
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struct hostent *Gethostbynamei(const char *name) 
{ 
struct hostent *р; 


if (ір = gethostbyname(name)] == NULL) 
dns error("Gethosthyname error"); 
return p; 
[ 
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B.5 DNS 风格 的 gethostbyname 函数 的 包装 函数 
csapp.h 头 文件 


rifndef __ CSAPP Н _ 
#define _ CSAPP Н — 


include «stdio.h- 
+#include «stdlib.h- 
4include «uniszd.h- 
include <string.h> 
#include «ctype. h> 
tinclude <səetjmp.Hh> 
include «signal.h- 
*include «esys/rime.hs 
include «sys/-ypes.h» 
"include «gyg/wait.h- 
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code/sre/csapp.c 


code/src/csapp.c 


code/sre/esapp.c 


code/src/csapp.c 


codefinciude/csapp.h 
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#include zsys/stat.h» 
include «fcentl,.h» 
$include «sys/mman.h- 
*include «errno.h- 
Kjinclude <math.h> 
Kinclude <pthread.h> 
tinclude «semaphore.h» 
include «sys/socket.h» 
"include «netdb.h- 
$include znetinet/in.h- 
K:nclude «arpa/inet.h» 


/* Default file permissions are DEF MODE & "DEF UMASK */ 
sdefine DEF, MODE 5 TRUSR!S, IWUSR|S IRGRPIS IWGRP|S ІКОТН|5 IWOTH 
*define DEF UMASK à IWGRPIS IWOTH 


A Simplifies calls to bind), connect(), and accepti} */ 
typedef struct sockaddr SA; 


/* Persistent state for the robust VO (Rio) package */ 
*define RIO BUFSLIZE 8292 
tvpedef struct Í 


-nt rio fd; /* descriptor for this internal buf */ 
añt rio спі; /* unread bytes m internal buf */ 
char *rio bufptr; /* next unread byte in internal buf */ 
char rio buf[RIO 3UFSIZE];  /*imtermal buffer */ 

] rio t; 


/* External variables */ 


extern int A^ errno; /* defined by BIND for DNS errors */ 
extern char **environ: /* defined by Шс */ 


/* Misc constants */ 


def ne MAXLINE 8192 Pr max text line length */ 
Kiefine MAXBUF 81892 Ре max VO buffer size */ 
tdef ne LISTENO 1024 ІЗ second argument to listen() */ 


/* Our own error-handiing functions */ 

void unix еггогісһағ *msgl; 

void posix, errorí(int code, char *msg!; 
void dns error;ichar *msg); 

vöid app error;char %пяд); 


/* Process control wrappers */ 


错误 处 理 





pid t Forkívoid]; 

void Бхесуе (сопзі char *fileaame, char *const argvi], char *const епур[]}; 
pid t Waitíint *status); 

pid t Waltpidipid і 2id, int "*iptr, int options): 

vold Killipid t pid, int signum}; 

unsigned int Sleep(unsianed int secs); 

vold Pause(void); 

unsigned int Alarmiunsigned inz seconds]; 

void Setpgidípid t pid, рід t розй); 

pid t Getpgrp!); 


/* Signal wrappers */ 

typedef void handler tí(int): 

handler t *Signalí(int signum, handler t *handler); 

void Sigprocmaskiint how, const sigset t *ser, sigset і *oldset); 
võid Sigemptyserísigset t *seti; 

vold Sigfillsetí(sigset t *sek]; 

void Sigaddsetísigset t *set, ^nt sigauum); 

void Sigdelset([sigset t *set, :nt signum); 

int Sigismembericonst sigset t *set, int signum!; 


i* Unix LO wrappers */ 

int Openíconst char "pathname, int flags, mode. t model; 

өніге t Read(int fd, void *buf, size 1 count): 

ssize t Wr:te(int fd, const void *buf, size.t count); 

ofi t Lseeklint fildes, off t offset, int whence): 

void Closeiint Ёа}; 

int Select(int n, fd set *readfds, fd set *writefds, fd set *ехсері Ёде, 
strucc timeval *timeouLi]: 

int DupZíint Ра, inr Iid2); 

void Stati(const char *filename, siruct stat *buf!: 

void Fstatiint fd, siruct stat *buf) ; 

+ Memory mapping wrappers */ 

void *Mmapivoid *addr, size t len, int prot, int flags, int Ға, off_t offset}; 

void Munmapivoid *start, size t length); 


/* Standard LO wrappers */ 

void Felosei FILE *fp); 

FILE *Fdopeni(int fd, const char *typej; 

char *Fgeig[char *ptr, iat n, FILE *stream): 
TILE *Fopeniconst char *filenàme, const char *model; 

void Fputsí(const char *ptr, FILE *stream); 

size t Freadivoid *ptr, size t size, size t nmemb, FILE *stream!; 
void Fwrite(const void *ptr, size t size, size t nmemb, FILE *streami; 
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/* Dynamic storage allocation wrappers */ 

vold *Mallccísize t size]; 

void *Realloc(void *ptr, size t size]; 
void *Callocí(size t nmemb, size t size); 
void Freeívoid *ptr); 


/* Sockets interface wrappers */ 

int Socketí(int domair, int type, int protocol); 

void Setsockoptíint s, int level, int optname, const void *optval, int оріјеп) ; 
void Bindí(int sockfd, struct scockaddr *my addr, int addrlen); 

void Listerí(int s, int backlog); 

int Accept(lnt s, struct sockaddr *addr, int *addrlenj; 

void Connectí(int sockíd, struct sockaddr %вегу addr, int addàrlen!; 


{* DNS wrappers */ 
struct hostent *Gethostbyname(const char *name!; 
struct hostent *Geithostbyaddrí(const char *addr, int len, int type); 


f* Pthreads thread control wrappers */ 

void Pthread createípthread t *tidp, pthread attr t *a-:trp, 
void * (*routinelí(ívoid *), void *argp;; 

void Ptaread joiní(pthread t tid, void **thread return); 

void Ptaread cancelipthread t rid); 

void Pturead detach(pthread t tid]: 

void Pt^áread exit(void *retval)l; 

pthread,t Pthread selfí(void!; 

void Pthread onceí(pthread once t *once control, void (*init function) (b: 

/* POSTX semaphore wrappers */ 

vold Sem ілікізет t *sem, int pshared, unsigned int value; 

сіс Pisem t *sem); 

void Уізет с *seml!; 


/* Rio (Robust РО) package */ 

ssize L rio readní(int fd, void *usrbu?:, Біде t n); 

ss1ze t rio writení(int fd, void *usrbuf, size t n); 

vOiC гіз readinitoí(rio t *rp, int fd): 

5size t rio readnoirio t *rp, void *usrbuf, size t n); 

$8ize t rio readlinebírio tL *rp, void *usrbufí, ѕіте т тахсеп); 


/* Wrappers for Rio package */ 

нві?е 1 Rio readn(int fd, void *usrbui, size t n); 
voi Кіз writení(int fd, void *usrbuf, size t n): 
void Біз readinit2í(rio t *rp, int Ға); 


B.4 
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ssize t Rio readnbi(rio t *rp, void *usrbuf, size t n); 
өні?е t Rio readlineb(rio t *rp, void *usrbuf, size t maxlen]; 


Жж Chentserver helper functions */ 
int open clientíd(char *hostname, int рогіпо) ; 
int open listenfd(int portno]; 


/* Wrappers for client/server helper functions */ 
int Open clientfd(char *hostname, int port); 
int Open listenfdí(int porti; 


#endif /* , CAPP AH , */ 


csapp.c 源 文 件 


#include "csapp.h" 
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code/include/csapp.h 
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* Error-handling functions 


ЖЖЖЖ dee eoe eere ж/ 


void unix,error(char *msg) Ро unix-stvle error */ 


{ 
fprintfístderr, 
ехісір); 


"Es; Жалп", msg, strerror(errno]): 


void posix error(int code, char *msg) /+ posix-style error */ 


{ 
fprintfístderr, 
exit (0); 


"is: €$sin", msg, strerrorícodel!; 


void dns, error(char msg} /*dusstyle error */ 


{ 
Iprintfístderr, 
exit[0); 


"Ев: DNS error $din", msg, h errzno); 


voiéC app erroríchar *msg) /* application error */ 


fprintf(stderr, 
ехісі0); 


"Ұсал", msg); 


code/src/csapp.c 
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ad } 
29 
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31 * Wrappers for Unix process control functions 


12 5 K SU sk de d oo Rob eoe R KOR x ЖЖ K e e oe eo p geo ee e o eb x жж/ 
33 

24 pid t Forkivoid) 

35 f 

i6 pid t pid; 

37 

38 if [ipid = fork()) < 0) 

i8 unix errorí"Fork error"): 
4% return pid; 

41 | 

42 


43 мола Execve(const char *filename, char *const argv[], char *const envp[]) 
44 I 


45 jf (execve(Filename, argv, envp) < 0) 
46 ыліх errorí("Execve error"): 
47-1 

48 

48 pid t Waití(int *status) 

50 í 

51 pid t pid; 

52 

53 if {ipid = waltístatus)) < Q) 

54 unix,errori"Wait error"); 

55 return pid; 

56 3 

57 

58 pid t Waitpidípid t pid, int *iptr, int options) 
59 Í 

60 pid t retpid; 

61 

52 if [iretpid = waitpidípid, iptr, options)! < 0) 
63 unix errorí("Waitpid error"); 

54 returníretpid): 

65 } 

БЫ 

67 void КІП (ріп t pic, int signum) 

68 | 

69 int rc; 

TÜ 

7] if { (їс = killipid, signum)]) < 0) 


72 unix error("Xill error"); 


100 
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104 
105 
106 
107 
108 
103 
112 
111 
112 
113 
114 
115 
116 
117 


错误 处 理 


void Pauseí) 

1 
(void)lpauseil; 
return: 


unsigned int Sleep[unsigned int secs) 
{ 


unsigned int rc; 


if {irc = sleepisecs?)] < 01 
unix errcr("5Sleep error"); 
return rë; 


unsigned int Alarmí(unsigned int seconds) { 
return alarm(seconds!); 


void Setpgidípid t pid, pid t pgid) { 
int rc; 


if {irc = setpgidipid, pgid)) < 0j 
unix errorí("Setpgid error"); 
return; 


pid t Getparpivoid) 1 
return getpgrp(); 


ЕТЕ eee жж ЕЕ жз аз ERROR eG 


* Wrappers for Unix signal functions 
ck ook dol к ааа ав 


handier t *Signalí(íint signum, handler,t *handler) 
{ 


struct sigaction action, oldà action; 


action.sa handler = handler; 
sigemptyset(&action.sa, mask); /* block sigs of type being handled */ 
action.sa flags = SA RESTART; /* restart syscalls if possible */ 
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118 if (sigactioní(signum, &action, &old action) < 0j 
1189 unix error("Signal error"); 

120 return (old action.sa handler): 

121 ] 

122 


123 void Sigprocmaskí(int how, const sigset, t *set, sigset t *oldset) 
124 | 


125 i£ (sigprccmàsk(how, set, oldset) < C) 
125 unix errorí"Sigprocmask error"); 
127 return; 

128 } 

129 

130 void Sigemptyserí(sigset С *set) 

131 | 

132 if (sigemptysetí(set) < 0) 

133 unix, errorí("Sigemptyset error"); 
134 return; 

135 ) 

136 

137 void Sigfillaset(sigset_t *set) 

138 I 

139 if (sigfillseriset) < 01 

140 unix,errorí"Sigfillset error"); 
141 return; 

142 3] 

143 

144 void Sigaddsetí(sigset t *set, int signum) 
145 1 

146 iE isigaddsetí(set, signum) < 0) 

147 unix errorí"Sigaddset error"): 
148 return; 

149 ) 

150 

151 void Sigdelset(ísigset t *set, int signum) 
152 | 

153 if [sigdelsetíset, signum) < 0) 

154 unix error("Sigdelset error"); 
155 return; 

155 ] 

157 


158 int Sigismemberí(const sigset t *set, int signum) 
158 { 


160 int rc; 
161 if {ire = sigismember(set, signum)) < 0) 
162 unix error("Sigismember error"); 
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return rc; 
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* Wrappers for Unix UO routines 
жж ж КЖ КЕЖЕ E E EE E КЖ Rd Re E E 


int Openíconst char *pathname, int flags, mode t mode) 
i 


int rc; 


if (irc = ọpen (pathname, flags, mode)) < 0) 
ипіх errori"Open error"); 
return rc; 


өеізсе t Readí(int fd, void *buf, size t count! 
{ 
есіте t rc: 


if (ДІС = read(fd, buf, count!) < 0) 


unix екгог ("Вега error"); 
return rc; 


ззіте t Wrlite(int fé, const veid *buf, size t count! 


i 
Ssize t rc; 
lif {ire = writetfd, buf, count)) < C) 
unix errorií'Write error"); 
return rg; 
j 


off t Lseek(int fildes, off t offset, int whence) 
i 


off t rc; 


if {irc = lseek(fildes, offset, whence)) < 0) 
unix, error(*Lseek error"); 
return rc; 


void Close(int ТО) 
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208 f 

209 inb rc; 

210 

211 if iirc = close(fd)) < 0) 

212 unix error("Close error"); 

213 ] 

214 

215 int Selectiint n, fd set *readfds, fd set *writefds, 
216 fd set *exceptfds, struct timeval *timeëout) 
217 f 

218 -nt rc; 

219 

220 LE (ire = selecti(n, readtds, writefds, exceptfds, timeout!) < 0) 
22] unix errorí"Select error"); 

222 return rc; 

223 1 

224 

225 int Dup2[int fdl, int Ға?) 

226 1 

AA -Tt rc; 

228 

228 1f {irc = dup2(fdl, fd2)) < 0) 

230 unlx_errorí("Dup2 error"); 

231 return rc; 

232 ) 

233 

234 чола Statí(const char *filename, struct stat *buf) 
235 ( 

236 1f istat(f:lename, buf) < 0) 

237 unix errorí("Stat error"): 

238 ] 

239 

240 void Fstat(int fd, struct stat *buf) 

24. { 

242 if (fstat(fd, buf) < 0} 

243 unix error("FstaL error"); 

244 ] 

245 
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247 — * Wrappers for memory mapping functions 
948 БЬЕТСЯ 


249 void *Mmap(void *addr, size L len, int pret, int flags, int fd, off t offset) 
250 { 

25 vold *ptr; 

252 


错误 处 理 815 


if ((ptr = mmap(addr, ien, prot, flags, £d, offset)) == ((void *] -1)? 
unix errorí("mmap error"); 
returníptr): 


void Munmapívoid *start, size t leng-h) 
[ 
if (munmap(start, length] < 0) 
unix,errorí"munmap error"); 


J SOROR жк ж жй ЖЖ жа joo ooo ok eoe ЖА КЖК КЖ RR R ЖЖ 


* Wrappers for dynamic storage allacation functions 
DEEE ЖЕЖ EEEE EEEE EEE ЕЖЕ КЖЕ КККК А E EEE E ЖЖ ЖА 


void *Mallocisize t size) 


( 
vold *p; 
If iip = mallocí(size)) == NULL] 
unix errorí('Malloc error"); 
return p; 
) 


void *Reallocivoid *ptr, size_t size) 
{ 
void *p; 


if (ip = realloc(ptr, size) == NULL) 
unix, errorí("Realloc error"); 
return р; 


void *Pallocí[size t nmemb, size | size) 
{ 


vold *э; 


if iip = calloc(nmemb, size]) == NULL) 
unix, error ("Call ос error"); 
return p; 


vold Free(void *prr) 
{ 
freeíptr]; 
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301 * Wrappers for the Standard UO functions, 

302 Жжжж Ж ЖЕ Ж pip ER Ж EREEREER EEE eb / 
303 void FcClose(FILE *IpJ 

304 ( 

303 if (Ес1озе{#р) += 0) 

305 unix erro-("Fclose error"); 
307 } 

308 

309 FILE *Fdopeníint fd, const char *type) 
319 1 

311 FILE *fp; 

312 

313 if (Ер = fdopen{fd, type)] == NULL) 
314 unix errorí"Fdopen error"): 
315 

315 return £b; 

317 } 

318 

319 char *Fgetsí(char *ptr, int n, FILE *stream) 
320 Í 

321 char *rptr; 

322 


323 if it(rpitr = fgets(ptr, n, stream)) == NULL) && ferrorí(stream)) 
324 app errorí("Fgets error"); 

325 

326 return rptr; 

327 } 

328 

329 FILE *Fopení(const char *filename, const char *mode) 

330 1| 


331 TILE *fp; 

332 

333 if iip = fopen(filename, model) == NULL! 
334 unix errorí("Fopen error"): 

iib 

336 return fp; 

337 ) 

338 

339 void Fputs {const char *ptr, FILE *stream! 
340 { 

341 if ifputsíiptr, stream) == БОЁ) 


342 unix errorí("Fputs error"); 


错误 处 再 


size t Freadí(void *ptr, size t size, віе t nmemb, FILE *stream) 


i 
әзге t n: 


ii ({ (п = ireadíptr, size, nmemb, stream)) < nmembj && ferror(stream)) 


unix errorí("Fread error"); 
return n; 
| 


void Fwriteí(const veid *ptr, size t size, size t nmemb, FILE *stream) 


{ 
if (fwriteíptr, size, nmemb, stream) < nmenmb) 
unix errorí("Fwrite error"); 


Jb oko кж ка ж же ET EEEE E 


* Sockets interface wrappers 
Жжж Ek E R R EEEE Жж ЕКЕ EER 


int Socket(int domain, int type, int protocol) 
1 


int rc; 


if (frc = socket (domain, Lype, protocol)) < 0) 
unix errorí("Socket error"): 
return rc; 


void Setsockoptiint s, int level, int optrame, const void *optval, int optlen) 


{ 
int rc; 


if ((rc = setsockoptí(s, level, optname, optval, optlen)) 


unix errorí("setsockopt error"): 


void Bind(int sockfd, struct sockaddr *my, addr, int addrlen) 


| 


int rc; 


if (ire = bind(sockfd, пу адаг, addrlen! < 0) 
unix error("Bind error"); 


« 0) 
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388 | 

383 

39) void Listen[(int s, int backlog} 

391 { 

392 int с; 

393 

394 if iire = listen(s, backlog)) < 0) 
395 unix errorí"Listen error"); 
396 ] 

397 

398 int Acceptiint s, struct sockaddr *addr, int *addrlen) 
i89 í 


400 inL rc; 

401 

402 1Ё (irc = acceptis, addr, addrlen)! < 0} 
403 unix erzror("Accept error"); 

404 return rc: 

405 | 

406 


407 void Connectiint socktd, stract sockaddr *serv, addr, int addrlen) 
305 í 


409 Int rc; 

АТС 

411 if [irg = connectísockfd, serv айдғ, addrlen!) < 0} 
412 unix errorí("Connect error"); 

413 1 

414 
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416 * DNS interface wrappers 


417 ЖҰТ ЖЕЗ ЖАЖА Ж ЖКК Ж 


418 

419 struct hostent *Gethostbyname(const char *name] 
420 | 

421 struct hosLent *p; 

422 

423 if iip = dethostbyname(name]) == NULL! 

424 dns error("'Gethostbyname error"): 

425 return p; 

426 } 

427 


128 struct hostent *Gethostbyaddrí(const char *addr, int len, int type) 
428 1 


430 struct tosteant *p; 
431 


432 if [ip = ge:hostbyaddr(addr, len, typel) == NULL) 


433 
224 
435 
436 
437 
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448 
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470 
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477 


dns errorí("Sethostbyaddr error"): 


retur р; 


错误 处 理 
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* Wrappers for Pthreads thread control functions 
жж ЖЕ Ж ККЖ КЖК КЖ Ж ЖЖ EE ES EEEE dee eoo eg 


void Prthread createipthread t *tidp, pthread attr t *attrp, 
void * (*routinerívoid *), void *argp! 


int rc; 


if (irc = pthread createitidp, 


attrp, 


routine, 


posix errorirc, "Pthread create error"); 


void Pihread cancel(pthread t tid) 


int rc; 


i£ {ire = ptaread cancelitidi) 


{ 


1= 0) 


posix етгогігс, "Pthread cancel error"); 


void Ріһгеай joinípthread t tid, void **thread return! 


int re: 


itf iirc = pthread, joinítid, 


void Pthread 3etachipthread, t tid] 


inz rë; 


1f (irc = pthrezd detachiítid)) 


thread return); !- 
ров1іх errorirc, "Pthread join error"): 


{ 


l= 0) 


pasix errorirc, "PL:hread detach error": 


void Pthread exit(void *retval) 


pthrezd ехігігесуа1); 


pLhread t Pthread self (void) 
returr pthread self); 


{ 


{ 


атар}! 


9) 


{ 


9) 
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478 

419 void Pthread onceí(pthread once t *once control, void ізіліс function)()] í 
480 pthread, onceítonce control, init, function); 

481 ) 

482 
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484 — * Wrappers for Posix semaphores 
485 жаака жж кж ЕЖЕ К 


486 


48" void Sem init(sem t *sem, int pshared, unsigned int value) 
488 ( 


483 if [sem ini-iísem, pshared, value) < 0) 
490 unix, errori"Sem init error"); 
491 ] 

492 

493 void P(sem_t *sem) 

492 f 

495 if (sem walti(sem) < 0) 

496 unix error("P error"); 

497 | 

498 

499 void V(sem t *sem) 

500 í 

501 if (sem розї (вет) < C) 

502 unix errorí"V error"); 

803 |] 

504 


505 {К Жжжж КЖ ККА КЕ ККЕ ЕЕЕ ЖЕЕ ooo КККК ККЖ КЕЕ ЕК КАЕ eol eee 


50€ * The Rio package - robust 170 functions 


507 ЖЖЖ жж KAK ЖК ро ЕЖ ЖЖЖ boe ЖЕЕ ЖЖЖЖ ЖЖ ЖЖ жж Ж} 
508 /* 
509 “то readn - robustly read n bytes (unbuffered) 


510 */ 

511 ssize t rio readn(int fd, void *usrbuf, size t mn) 
512 Í 

513 Size t nleft = n; 

514 еңісе t nread; 

515 char *bufp = usrbuf; 

515 

517 while (nleft > 0) ( 

518 itf [(nread = reací(fd, bufp, nleft)) < 0) | 
519 if (errno == EINTR) /* interrupted by sig handler return */ 
520 nread - 0; /* and call read() again */ 
521 else 


522 return -1; /* ermo set by regadi) */ 


HALTE 


! 
else if (nread == 0) 
break; [* EOF */ 
nleft -- nread: 
bu p += nread; 
| 
return іп - nle£ft); f* return >= Q */ 
} 
ғ ж 
* rio. writen - robustly write n bytes (unbuffered) 
* z 


8size t rio writen(int fd, void *usrbuif, size, t n) 
i 

size_t nleft = п; 

ssize_t nwritLen; 

char *bufp = usrbuf; 


wnile (nleft » 0) ( 
if ((nwritten = write([fd, bufp, nieft)| <= D) 1 


if (errno == EINTR) /*intemupted by sig handler return */ 
nwritten - апа call write() again */ 
else 
return -.; ҒҒ errorno set by write() */ 
| 
піеІЕ -= nwritten: 
bufp += nwritten; 
) 
return n; 
) 
/* 


* гіо read - This is a wrapper for the Unix read() function that 

* transfers mintn, rio, cnt) bytes from an internal buffer to a user 

* buffer, where n is the number of bytes requested by the user and 

* rio спі is the number of unread bytes in the internal buffer. On 

* entry, rio, read() refills the internal buffer via a call to 

* read() if the internal buffer is empty. 

*/ 
static s8ize t ric read(rio t *rp, char *usrbuf, size L n) 
i 


4 


int cnt; 


while (rp-»rio cnt <= 0} [| (тей! If buf is empty */ 


625 


Mr B 


rp-»rio cnt = read(rp-»rio, Ed, rp-»rio buf, 
sizeofirp-»-r.o buf]: 
if [rp-»rio cnt < ШУ | 
it (errno != EINTR} /*interupted by sig handler return */ 
return -1; 
| 
сізе if (rp-»rio cnt == 0) /#ЕОЕ*#/ 
return U: 
else 
rp-»rio bufptr = rp-»rio buf; /*resetbuffer ptr */ 


/* Copy minin, rp-»rio cnt) bytes from internal buf to user buf */ 
cnt - n: 
if (rp-»rio cnt < n) 
crt = rp-»rio, cnt; 
memcpyí(usrbuf, rp-»-rio,bufptr, crt]; 
rp-»rio,bufiptr += cnt; 
гре» бо cont -= cent; 
return cnt: 


* rio readinitb - Associate a descriptor with a read buffer and reset buffer 


%; 


vold rio readinitbí(rio t *rp, int Ға) 


rp-»rio fd = fd: 
rp-»rio cn- - (; 
гр->гіс bufptr = rp-»rio Үні: 


ШЕ. 


* rio readnb - Robustly read n bytes (buffered) 
*/ 


ssize_t rio readnbí(rio t *rp, void *usrbuf, size t n) 


size t nlet = n; 
sslze t nread; 
char *bufp = vsrbutf; 


while (nleft » 0) { 
if ((nread = rio readí(rp, bufp, nleft)) < 0) 


if (errna == EINTE) /* interrupted by sig handler return */ 


nread - 0; /* call read() again */ 


/ 


错误 处 理 


else 
return -1; /* ermo set by read() */ 
) 
eise if !nread == Ü) 
break; ж EOF */ 
nleft -z nread; 


bufp += nread; 
} 
return ín - rleft):  /*retum »-( */ 


* 


* rio readlineb - robustly read a text line (buffered) 
* 0 


өсісе t rio readlineb(rio t *rp, void *usrbuf, size t max.en) 


| 


int n, тє; 
char c, *bufp = usrbuf; 


for {п = 1; n < naxlen; n++) 1 


if (ire = rio readirp, sC, 13) == 1) Í 
*bufp++ = c; 
if (C == "TY 
break; 
} eise if {гс == Q) í 
if іп == 1) 
return 0;  /* EOF, no data read */ 
else 
break; ж EOF, some data was read */ 
] else 
return -1; /* error */ 
| 
*butp = 0; 
return n; 


[Ecce жЕ ЕКЕНЖ ражон 


* Wrappers for robust 1/О routines 
ккк К КЕКЕ ЖЕЛ o ok афву 


SSize t Rio readniint fd, void *ptr, size t nbytes) 


{ 


зѕіе t n; 


if (іп = rio readn(fd, ptr, nbytes)) < 0) 
unix error["Rio, -eadn error"); 


827 
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658 return n; 

659 } 

560 

561 void Rio writen(int fd, void *usrbuf, size t n) 
562 f 

563 if [rio writenífd, usrbuf, n) != n) 

&64 unix error("Rio writenb error"): 

565 ] 

666 

567 void Rio,readinitbirio t *rp, int Ға) 

668 1 

659 үзе readinitbírp. Ed); 

670 ] 

671 

672 ssize t Rio readnb(rio t *rp, void *usrbuf, size t п) 
573 1 


674 S5ize t rc; 

b 5 

576 itf ((Үс = rio readnb(rp, usrbuf, n)] < 0) 
577 unix error("Rio readnb error"; 

678 return rc; 

B798 } 

650 


681 ssize t Rio readlinebirio t *rp, void *usrbuf, size t maxlen) 
682 ( 


583 ssize LE rc; 

584 

585 if tirg = rio гезд11ігерігр, usrbuf, тах1еп)) < 0) 
58E€ unix error("Rio readlineb error"): 

687 return гє; 

EBE } 

685 


590 {ЕЖЕ КК жж жака кі ж 


691  *Clientserver helper functions 

592 ДЬААН 

591 J/s* 

694  * open clientid - open connection to server at «hostname, port» 
695 * and return a socket descriptor ready for reading and writing, 
696 ? Returns -| and sets ermo on Unix error. 

697 + Returns 2 and sets h епо on DNS (gethostbyname) error. 
698  */ 

693 int open clientfd(char *hostname, int port) 
70004 

701 int clientfd; 

702 struct hostent *hp: 


703 
#04 
705 
706 
107 
708 
709 
710 
ТП 
712 
713 
714 
715 
716 
717 
718 
119 
720 
721 
722 
723 
724 
725 
725 
727 
728 
729 
+30 
731 
732 
733 
734 
735 
136 
137 
138 
738 
740 
741 
142 
743 
744 
745 
746 
ТАТ 


/ 


int 


| 


错误 处 理 


struct sockaddr in serveraddr; 


if 


(iclientfd = socket(AF INET, SOCK STREAM, 0)} < 0} 


return -1; /*check errno for cause of error */ 


/* Fill in the server's IP address and port */ 
if {{һр = gethostbyname(hostname)! 
return -2; /* check h епо for cause af error */ 


bzerottchar *) 


&serveraddr, sizeo?í 


serveraddr.sin family = AF ІМЕТ; 
bcopytichar *)hp-»2h айах, 


(char *J&serveraddr.sin addr.s addr, hp-»h length;; 


Serveraddr.sin port = htonsíport): 


/* Establish a connection with the server */ 


if 


return -1: 


return clientfd; 


Ж 


(connect (clientfd, 


(SA *) &£serveraddr, 


== NULL] 


aerveraddr]); 


ж open, listenfd - open and return a listening socket on port 
Returns -1 and sets ermo on Unix error. 


* 


“/ 


open listenfdíint port) 


int listen[d, optval-l; 
struct sockaddr in serveraddr:; 


/* Create a socket descriptor */ 
it (i(listenfd = socket(AF INET, SOCK STREAM, 0}) < 0) 


return -1; 


/* Eliminates "Address already in use" error from bind. */ 


if 


[(setsockoptí(listenfd, SOL SOCKET, 50 REUSEADDR, 


(const void *J&optval , sizeof(int]) < 0) 


return -1; 


/* Listenfd will be an endpoint for all requests to port 
on any IP address for this host */ 


bzeroití(char *) &serveraddr, 


serveraddr.sin family = AF INET; 
serveraddr.sin addr.s addr = htonlí(INADDR ANY); 
serveraddr.sin рогі = htons[í(unsigned short)port); 


if 


(bind(listenfd, 


{5А *Akserveraddr, 


sizeofíserveraddr!!; 


sizeofí(serveraddr!! 


Es 


Ü 


eizeofíserveraddr): 


' 
Ш 


629 


< 0) 


830 


748 
749 
750 
751 
752 
753 
754 
755 
206 
757 
FDB 
753 
760 
761 
76? 
763 
764 
765 
766 
76? 
768 
765 
TTO 
P 
772 
773 
ТА 
TT 
ШИ: 
TT 
TTE 
779 
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return -і; 


/* Make it a listening socket ready to accept connection requests */ 
if (listen(listenfd, LISTENQ) < 0) 

return -і; 
return listenfd; 


fcn ES ESEE EEE SEEE EEEE EEEE EEE 232242422241. 


ж Wrappers for the client/server helper routines 
ҚҰЗ ETE EEEE EE ЕЕ EEE EE EEE TEE EEEE TE EE EEN 
int Open clientfdíchar *hostname, int port) 
{ 

int rc; 


1f i(rc = open, clientfdihostname, рогі) } < 01 1 
if (rc == -1) 
unix errorí"UÜpen clientfd Unix error"); 
else 
dns erroríi"*Open clientfd DNS error"); 


| 


return тє; 


int Open_listenf3(int port) 
d 


int rc; 
1Ї {ire = open listenfdiport)) < D) 


unix errorí("Open listenfd error"); 
return rc; 


code/src/csapp.c 


